GitHub值得关注记录

简介: GitHub关注记录@Date 2017.06.02AI深度学习笔记https://github.com/exacity/deeplearningbook-chineseNLTK下载使用的数据https://github.

GitHub关注记录

@Date 2017.06.02

AI

深度学习笔记
https://github.com/exacity/deeplearningbook-chinese

NLTK下载使用的数据
https://github.com/nltk/nltk_data

SnowNLP(python)处理中文文本内容
https://github.com/isnowfy/snownlp

DeepQA 基于nltk tensorflow训练的问答
https://github.com/xuanhan863/DeepQA

Tensorflow Chatbot : Implement Tensorflows Sequence to Sequence model to train a chatbot
https://github.com/llSourcell/tensorflow_chatbot

ChatterBot is a machine-learning based conversational dialog engine build in Python
https://github.com/gunthercox/ChatterBot

IBM开源的JavaQA系统
https://github.com/ysc/QuestionAnsweringSystem

ChatBotCourse:自己动手做聊天机器人教程
https://github.com/warmheartli/ChatBotCourse

聊天机器人的训练语料
https://github.com/rustch3n/dgk_lost_conv

Java版本的深度学习框架
https://github.com/deeplearning4j/deeplearning4j

Java分词工具HanLP
https://github.com/hankcs/HanLP

基于RNN训练的自动取名python工程
https://github.com/bitdust/WamaCry

Stanford CoreNLP
https://github.com/stanfordnlp/CoreNLP

DrQA(facebook)
https://github.com/facebookresearch/DrQA


Python

PornHub爬虫

  • https://github.com/xiyouMc/WebHubBot
  • PornHubBot项目主要是爬取全球最大成人网站PornHub的视频标题、时长、mp4链接、封面URL和具体的PornHub链接
  • 项目爬的是PornHub.com
  • 10个线程

指定爬取微博大V以及粉丝的对话记录
https://github.com/jinfagang/weibo_terminator_workflow
https://github.com/jinfagang/weibo_terminater

python删除知乎回答等操作脚本
https://github.com/rollenholt/fuck_zhihu

他人学习python的记录
https://github.com/xxg1413/python

Python爬虫框架scrapy-demo
https://github.com/geekan/scrapy-examples


工具包

美团SQLAdvisor:输入SQL,输出索引优化建议
https://github.com/Meituan-Dianping/SQLAdvisor

蚂蚁笔记Leanote(markdown edit)
https://github.com/leanote/leanote

MarkDown编辑器(基于QT)
https://github.com/cloose/CuteMarkEd

word分词是一个Java实现的分布式的中文分词组件
https://github.com/ysc/word

Java版本的文字转拼音工具包
https://github.com/belerweb/pinyin4j

VIM配置
https://github.com/rarezhang/simple_vim_setting

在线写MarkDown简历工具
https://github.com/geekcompany/DeerResume

Java版本的Redis Client工具
https://github.com/caoxinyu/RedisClient


安全

XSS'OR - Hack with JavaScript
https://github.com/evilcos/xssor2

类似永恒之蓝的病毒程序
https://github.com/bitdust/WamaCry

Pocsuite: 远程漏洞检测框架
https://github.com/knownsec/Pocsuite

Kali Linux -- NetHunter:Bad USB 技术实现流量劫持的功能
https://github.com/offensive-security/kali-nethunter

PoisonTap : 将USB设备伪装成网卡进而劫持目标设备的网络流量
https://github.com/samyk/poisontap


开源技术集合
公司

Alibaba开源代码

https://github.com/alibaba

中间件

rocketMQ
https://github.com/apache/rocketmq

小米open-falcon : 互联网企业级监控系统
https://github.com/XiaoMi/open-falcon

MySql分库分表中间件,改编自Cobar,结合了Cobar和TDDL的优势
https://github.com/brucexx/heisenberg

MyCAT : 分表分库中间件
https://github.com/MyCATApache/Mycat-Server

Mycat-JCache
https://github.com/MyCATApache/Mycat-JCache

阿里云OSS SDK源码
https://github.com/aliyun/aliyun-oss-java-sdk

Turbine实时流低延时高吞吐量的聚合器(汇聚分布式服务的数据)
https://github.com/Netflix/Turbine

spring-boot-starter-dubbo
https://github.com/teaey/spring-boot-starter-dubbo

jvm-profiling-tools/perf-map-agent (jvmti的agent,可以倒出内存地址符号)
https://github.com/jvm-profiling-tools/perf-map-agent

蚂蚁金服开源:SOFATracer 是一个用于分布式系统调用跟踪的中间件
https://github.com/alipay/sofa-tracer

蚂蚁金服开源: SOFARPC
https://github.com/alipay/sofa-rpc

框架

后端架构师技术图谱(重点推荐-技术栈全)
https://github.com/xingshaocheng/architect-awesome

基于Spring Boot/Spring Security/JWT的REST服务安全认证
https://github.com/jonsychen/rest-security-demo

基于Spring Boot/Spring Cloud 的微服务架构
https://github.com/jonsychen/microservices-examples

hsweb-framework : 基于SpringBoot&MyBaits快速搭建企业后台管理系统的基础项目
https://github.com/hs-web/hsweb-framework

基于Spring+SpringMVC+Mybatis分布式敏捷开发系统架构,提供整套公共微服务服务模块:集中权限管理(单点登录)、内容管理、支付中心、用户管理(支持第三方登录)、微信平台、存储系统、配置中心、日志分析、任务和通知等,支持服务治理、监控和追踪,努力为中小型企业打造全方位J2EE企业级开发解决方案。
https://github.com/shuzheng/zheng

PayMap是一个使用Java语言集成三方支付的小Demo
https://github.com/Martin404/PayMap

JStock is a free stock market software for 36 countries
https://github.com/yccheok/jstock

Java版本的竞价框架
https://github.com/LMAX-Exchange/disruptor

基于springMVC+springSecurity3.x+Mybaits3.x的权限系统
https://github.com/lanyuancom/lanyuan

Vert.x : 事件驱动的高性能处理请求服务端
https://github.com/eclipse/vert.x

基于 Spring Cloud 的微服务架构
https://github.com/zhangxd1989/spring-boot-cloud

学习

程序员技术挑战网站(在线编程学习任务)
https://github.com/FreeCodeCampChina/freecodecamp.cn

他人的春招面试总结
https://github.com/HuangQinJian/Interview-Questions

基于网页游戏学习SQL
https://github.com/Audi-1/sqli-labs

收集和RTB有关的文章集合
https://github.com/wnzhang/rtb-papers

设计模式集合
https://github.com/iluwatar/java-design-patterns


前端

axios:js中http请求包
https://github.com/mzabriskie/axios

相关文章
|
26天前
|
人工智能 文字识别 异构计算
关于github开源ocr项目的疑问
小白尝试Python OCR学习,遇到报错。尝试Paddle OCR部署失败,Tesseract OCR在Colab误操作后恢复失败。EasyOCR在Colab和阿里天池Notebook成功,但GPU资源不足。其他平台部署不顺,决定使用WebUI或阿里云轻应用。求教OCR项目部署到本地及简单OCR项目推荐。
26 1
|
27天前
|
人工智能 自然语言处理 iOS开发
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
|
27天前
|
存储 Web App开发 人工智能
『GitHub项目圈选18』推荐5款本周 超实用 的开源项目
『GitHub项目圈选18』推荐5款本周 超实用 的开源项目
|
27天前
|
人工智能 物联网 机器人
『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目
『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目
145 1
|
27天前
|
JSON 搜索推荐 程序员
『GitHub项目圈选15』推荐5款本周 深受程序员喜爱 的开源项目
『GitHub项目圈选15』推荐5款本周 深受程序员喜爱 的开源项目
|
27天前
|
人工智能 自然语言处理 NoSQL
『GitHub项目圈选13』推荐5款本周 让人爱不释手 的开源项目
『GitHub项目圈选13』推荐5款本周 让人爱不释手 的开源项目
|
28天前
|
SQL NoSQL Linux
『GitHub项目圈选11』推荐5款本周 深受开发人员青睐 的开源项目
『GitHub项目圈选11』推荐5款本周 深受开发人员青睐 的开源项目
|
28天前
|
存储 人工智能 API
『GitHub项目圈选10』推荐5款本周 实用给力 的开源项目
『GitHub项目圈选10』推荐5款本周 实用给力 的开源项目
|
28天前
|
人工智能 Java Linux
『GitHub项目圈选09』推荐5款本周大佬都在用的开源项目
『GitHub项目圈选09』推荐5款本周大佬都在用的开源项目