guoning-tud / homo Goto Github PK

View Code? Open in Web Editor NEW

This project forked from vufa/homo

0.0 1.0 0.0 4.75 MB

一个基于离线唤醒，自然语言理解和情感分析的开源自然交互系统

Home Page: https://homo.codist.me/

License: MIT License

Go 53.69% Makefile 2.15% JavaScript 13.20% CSS 5.59% HTML 1.16% Shell 4.53% Python 17.13% Dockerfile 2.55%

homo's Introduction

Homo

一个基于离线唤醒，自然语言理解和情感分析的开源自然交互系统

演示视频(BiliBili)： https://www.bilibili.com/video/av54654613

功能

离线唤醒
- 基于开源轻量级语音识别引擎PocketSphinx实现
- 使用开源工具集CMUCLMTK进行离线语言模型训练
在线语音识别
- 调用百度在线语音识别API
语音合成：
- 调用百度在线语音合成API
自然语言理解
- 基于开源自然语言理解框架Rasa NLU实现
- 采用开源信息提取工具集MITIE构建用于Rasa NLU进行实体识别和意图识别的模型
- 意图识别分类采用开源机器学习框架scikit-learn
- 中文分词采用开源分词组件jieba
文本情感分析
- 基于支持向量机(SVM)算法进行情感极性分析
- word2vec模型构建采用开源主题建模工具Gensim
- (可选)基于逻辑回归(Logistic Regression)算法的情感极性分类器实现

快速开始(Linux)
文档
发展路线
贡献
捐赠
协议

快速开始(Linux)

获取Homo源码：

git clone https://github.com/countstarlight/homo.git

参照文档获取Homo运行所需数据：https://homo.codist.me/docs/dataset/

确保已经安装Docker，运行(如果当前用户不在 docker 组里，运行 run.sh 需要 root 权限)：

cd homo
cp conf/example_app.ini conf/app.ini
./run.sh

这会默认从docker hub下载并启动镜像，也可以使用阿里云构建的镜像：

./run.sh -a

run.sh 支持的命令：

$ ./run.sh -h
 附加命令:
 -p/--pull      获取/更新 镜像，默认从docker hub获取，使用 '-p a' 或 '-p ali' 从阿里云获取
 -a/--aliyun    运行阿里云Docker镜像(默认运行docker hub镜像)
 -d/--debug     用于调试，会使用Docker容器内的bash，默认调试docker hub镜像，使用 '-d a' 或 '-d ali' 调试阿里云镜像
 -h/--help      显示此帮助信息