结巴分词是一款优秀的中文分词库,之前在python应用中有使用,目前在php业务中需要接入,但对于php而言,fpm的形式导致每次请求的词典加载耗时过长,因此提供基于laravels(swoole)的分词服务,方便快速部署简单场景下的分词服务。
依赖 | 说明 |
---|---|
PHP | >= 7.2.0 |
Swoole扩展 | >= 4.x 推荐4.2.3+ |
请自行修改get请求的content参数内容
-
中文分词
-
关键词提取
-
分词位置标注
-
分词词性标注
请先确保 swoole、composer 已安装。如未安装可根据链接中的官方文档进行安装
-
克隆代码
git clone https://github.com/wyq2214368/laravel-jieba.git
-
composer安装依赖
composer install
以下的步骤是laravel及laravels的相关配置,您可以选择使用
php artisan install
指令一键完成。或根据相应文档完成设置 -
创建.env文件
cp .env.example .env
-
生成laravel的key
php artisan key:generate
-
文件夹权限设置
chmod -R 777 storage/ chmod -R 777 bootstrap/cache/
可视情况合理分配需要的权限
或分配php-fpm进程用户为所有者
choown -R apache:apache ./
-
启动服务
php artisan serve
如果您不想启动laravel server而是使用laravels服务,可以通过
php artisan install
指令启动laravels服务,或通过laravels文档自行启动 -
访问并测试服务
服务启动后可通过 http://127.0.0.1:8000/api/cut?content=吃葡萄不吐葡萄皮
如您启动的laravels服务,则需要使用laravels配置的端口(默认是 5200)
-
如果需要切换词典,可以修改.env中的DICT_TYPE,jieba提供了big、normal、small三种规格,参考其他詞典
欢迎star~