业界动态
免费在线语料库
2024-11-07 20:43
# 说明

免费在线语料库

该库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作 该库搜集了包含 - chatterbot - 豆瓣多轮 - PTT八卦语料 - 青云语料 - 电视剧对白语料 - 贴吧论坛回帖语料 - 微博语料 - 小黄鸡语料 共8个公开闲聊常用语料和短信,白鹭时代问答等语料。 并对8个常见语料的数据进行了统一化规整和处理,达到直接可以粗略使用的目的。 **使用该项目,即可对所有的聊天语料进行一次性的处理和统一下载,不需要到处自己去搜集下载和分别处理各种不同的格式。* # 环境 python3 # 处理过程 将各个来源的语料按照其原格式进行提取,提取后进行繁体字转换,然后统一变成一轮一轮的对话。 # 使用方法 将解压后的raw_chat_corpus文件夹放到当前目录下 目录结构为 ``` raw_chat_corpus -- language -- process_pipelines -- raw_chat_corpus ---- chatterbot-1k ---- douban-multiturn-100w ---- .... -- main.py -- ... ``` 执行命令即可 ```bash python main.py ``` 或者 ```bash python3 main.py ``` # 生成结果 每个来源的语料分别生成一个独立的*.tsv文件,都放在新生成的clean_chat_corpus文件夹下。 生成结果格式为 tsv格式,每行是一个样本,先是query,再是answer ``` query answer ``` # 结果的使用 这个就根据每个人不同的情况自主使用即可 个人对于聊天机器人方向实践也不是很多,以下一篇之前写的知乎专栏供参考 **《从产品完整性的角度浅谈chatbot》** 文章粗略讲解了如下一些方面,介绍了聊天机器人在实际产品化过程中可能遇到的问题和解决办法。 1. chatbot自身人格的设置 1. 产品上线需要考虑的敏感词处理 1. 文本检索模型的使用 1. 文本生成模型的使用 1. 回答打分机制 1. 万能回答的使用策略 1. 多媒体消息的处理 1. 产品模型部署的问题 # 版权说明    以上就是本篇文章【免费在线语料库】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/news/491.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多   
最新新闻
icp信息查询 icp信息查询系统
    域名信息DNICP(Domain Name Internet Content Provider)的目的就是为了防止在网上从事非法的网站经营活动&
bi数据分析工具
bi数据分析工具是一款非常专业的线上办公软件,这款软件可以帮助用户快速整理各种表格,直接生成柱状图,了解企业的各项经营情况
【“数智说”系列人物对话】上海市经信委钱晓:从“上海数字”到“数字上海”
为贯彻落实上海市委、市政府《关于全面推进上海城市数字化转型的意见》精神,推动“经济、生活、治理”全面数字化转型,引导全社
元宵祝福语简洁大气
在学习、工作乃至生活中,大家都有写祝福语的经历,对祝福语很是熟悉吧,祝福语是指对人们的美好祝福的语句。下面是小编整理的元
AI文档解析软件大PK:准确度、速度、多样性对比一览
作为一位热衷于科技的爱好者,我对AI文章信息提取技术怀抱极大兴趣并期待它带来的惊喜改进。在这次分享中,我会以谦虚但详尽的方
又一种农产品上热搜 看点居然是能“手撕”
新京报讯(记者 景啸尘)继春节前的“车厘子”上过热搜后,这两天又有一种农产品登上了微博和抖音热搜,就是咱们常见的凤梨,而
《天津市人民政府办公厅关于进一步加强征地管理工作的通知》政策解读
近日,市政府办公厅正式印发了《关于进一步加强征地管理工作的通知》(津政办发〔2022〕13号)(以下简称《通知》),有关政策解
2024年高考英语的热点词汇 - New quality productive forces(新质生产力)
高考英语阅读理解题占比30%,而且其他题项均涉及对阅读速度和理解质量的考查,可谓得阅读者,得150。大部分同学比较畏惧的就是Di
TikTok东南亚卖家宝典:《2024全球消费趋势白皮书》东南亚篇
TikTok官方发布《2024全球消费趋势白皮书》美区篇同时也推出了东南亚篇,《2024全球消费趋势白皮书》从赛道、渠道、价格、潮流、
AI大模型推理的详细过程和推理优化技术,以及代码实战样例
大家好,我是微学AI,今天给大家介绍一下AI大模型推理的详细过程和推理优化技术,以及代码实战样例,同
本企业新闻