NLP环境搭建(Rasa)

本文最后更新于 almost 4 years ago,文中所描述的信息可能已发生改变。

虽说环境搭建算不上啥干货,但是对于本人而言,每次搭环境都要重新找配置找资源 过程繁琐且浪费时间,所以写篇文章记录,也就是说这篇文章其实是备忘录 记录使用Rasa的过程,相关项目也许会上传Github

在Windows环境下

环境说明

系统版本:Windows 10专业版 20H2 Anaconda版本:3-2020.11-Windows-x86_64 Python版本:3.8.5 cuda:10.1 tensorflow:2.3.1(安装Rasa自带) Rasa UI:3.0.3

安装Anaconda

Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项

国内用户请使用:Anaconda清华镜像源
官方网站:https://www.anaconda.com/

安装CUDA

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台 总而言之,若你想使用GPU为机器学习加速,便需要安装CUDA√(相关包有pytorch、tensorflow等)

CUDA 10.1下载链接:https://developer.nvidia.com/cuda-10.1-download-archive-base

安装过程偶见自动重启现象,请在安装CUDA时选择自定义,分别安装图形驱动程序CUDA

安装tensorflow

官方文档:https://tensorflow.google.cn/

硬件要求

  • 支持以下带有 GPU 的设备:
    • CUDA® 架构为 3.5、3.7、5.2、6.0、6.1、7.0 或更高的 NVIDIA® GPU 卡。请参阅支持 CUDA® 的 GPU 卡列表
    • 在配备 NVIDIA® Ampere GPU(CUDA 架构 8.0)或更高版本的系统上,内核已从 PTX 经过了 JIT 编译,因此 TensorFlow 的启动时间可能需要 30 多分钟。通过使用 export CUDA_CACHE_MAXSIZE=2147483648 增加默认 JIT 缓存大小,即可将此系统开销限制为仅在首次启动时发生(有关详细信息,请参阅 JIT 缓存
    • 对于 CUDA® 架构不受支持的 GPU,或为了避免从 PTX 进行 JIT 编译,亦或是为了使用不同版本的 NVIDIA® 库,请参阅在 Linux 下从源代码编译指南
    • 软件包不包含 PTX 代码,但最新支持的 CUDA® 架构除外;因此,如果设置了 CUDA_FORCE_PTX_JIT=1,TensorFlow 将无法在旧版 GPU 上加载。(有关详细信息,请参阅应用兼容性

软件要求

系统要求

通过pip安装

pip install tensorflow

安装过慢请访问 pypi 自行下载对应版本whl文件,例:tensorflow-2.4.0-cp38-cp38-win_amd64.whl

pip install .\tensorflow-2.4.0-cp38-cp38-win_amd64.whl

安装Node.js

官方网站:https://nodejs.org/zh-cn/

淘宝镜像源:npm config set registry https://registry.npm.taobao.org
官方源:npm config set registry http://www.npmjs.org

安装Rasa

Rasa 是最火的聊天机器人框架,是基于机器学习和自然语言处理技术开发的系统 Rasa 中文官方文档包括聊天机器人,上下文管理,多伦对话,意图识别,填槽,中文聊天机器人开发必备手册

中文文档:http://www.rasachatbot.com/

Rasa 的推荐安装方式是通过pip:

pip install rasa-x --extra-index-url https://pypi.rasa.com/simple

解决方案:

[global]
index-url = https://mirrors.aliyun.com/pypi/simple
[install]
trusted-host = mirrors.aliyun.com

安装spaCy

spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库,你也可以在这里找到想要的语言模型

官方文档:https://spacy.io/models

你可以用以下命令安装:

pip install rasa[spacy]
python -m spacy download en_core_web_md
python -m spacy link en_core_web_md en

命令行下载过慢时使用离线安装: 例:下载中文包

pip install zh_core_web_md-2.3.1.tar.gz

语言包路径:C:\Users\YOU\anaconda3\Lib\site-packages\spacy\data

安装Rasa UI

通过npm安装

git clone https://github.com/paschmann/rasa-ui.git
cd rasa-ui
npm install

建议使用cnpm可规避大部分问题 解决方案:


Gitmoji速查表
关于Valine在leancloud国际版无法使用的问题