商务服务
语言大数据——北语汉语语料库隆重上线
2024-11-07 23:11

 

语言大数据——北语汉语语料库隆重上线

  为顺应大数据视角下语言学研究的发展和语料资源共享的趋势,北京语言大学汉语国际教育技术研究中心研制的《北京语言大学现代汉语语料库(BLCU Chinese Corpus,简称BCC)》正式上线。汉语国际教育技术研究中心经过多年的语料积累和技术积累,对100亿字的报刊、现代文学和微博语料进行了自动分词和词性标注,并建立了全文检索系统,现上线提供服务。BCC系统将为汉语研究、社会学研究和语言教学提供第一手的语言材料和数据统计,为进一步推进我校的语言信息化建设进程提供动力。

 

  该系统经过一段时间的内部测试后,于9月3日正式版上线。地址:http://bcc.blcu.edu.cn/  BCC系统不仅仅支持100亿字语料上任意字符串的全文检索,还支持北大词性标注体系下的词性串和句法检索。与此同时还根据语料类型开辟了垂直搜索功能。这在国内还属首创。

 

带词性的检索实例(我今天真+形容词)

语言模式查询实例(太*以至于)

  BCC系统也支持长距离依存的语言模式检索。方便对高度泛化和抽象的语法现象进行实证研究。在检索结果中,用户可以对已有结果进行筛选,排除或保留一部分检索结果,使用非常方便。

 

  本着数据开放的精神,除了显示检索语料外,还可以提供1000条样例下载,与全局的语料样例统计。用户还可以方便查看原始语料和标注结果。

 

数据统计界面

  据汉语国际教育技术研究中心荀恩东教授介绍,BCC系统的语料规模将我国现有开放语料库检索系统(教育部语用所1945万字;北大CCL语料库3亿字)的规模提升了两个量级,在汉语言学界是十分领先的。BCC系统检索模式的多样性和对用户友好的界面设计也符合当今潮流。汉语国际教育技术研究中心的BCC系统是顺应语言学科大数据潮流的典范成果,是该机构多年来注意资源积累和技术加工的劳动结晶。BCC必将为北京语言大学和全球现代汉语的研究提供重要的工具支持与数据支撑。

 

  BCC系统访问:http://bcc.blcu.edu.cn/

    以上就是本篇文章【语言大数据——北语汉语语料库隆重上线】的全部内容了,欢迎阅览 ! 文章地址:http://nhjcxspj.xhstdz.com/news/1282.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 物流园资讯移动站 http://yishengsujiao.xhstdz.com/ , 查看更多   
最新新闻
小店随心推凸显三大优势 直击抖音电商用户投放痛点助力经营成长
  近年来,以直播、短视频为代表的电商新业态迅速崛起,在为实体经济赋能赋值的同时,自身也展现出强劲的生命力。其中,抖音电
抖音小店怎么查看收入总额多少
抖音小店是一种通过抖音平台进行销售的电商模式,众多店家在平台上售卖各种商品,通过短视频、直播等方式吸引粉丝,实现销售收入
抖音严审赛道,2个月极速引流增客,登上好评榜top3!
1个月内从0-1打通线上到线下获客核销的全链路2个月时间登上好评榜top3产后康复赛道,究竟如何这样迅速崛起?01产后康复赛道的线
2014网络最有实力的十大红人与网络十大红人资料(全网公正)全网转载!
  第一:网络红人龚心逸龚心逸,福建龙岩人,其2007至2011年一度带领杀马特家族走向网络颠峰。引导中国网络
发出重农强农强烈信号!三个关键词解读2023年中央一号文件
  央广网北京2月14日消息(记者王晶)2月13日,《中共中央 国务院关于做好2023年全面推进乡村振兴重点工作的意见》(以下简称
抖音AI写作作品发布攻略:如何高效展示创作才华
抖音AI写作作品发布攻略:如何高效展示创作才华在数字化时代,人工智能的崛起为创作领域带来了前所未有的变革。抖音作为一款流行
八大类主流工业仿真平台【心累指数】终极评测(上)
有一个神奇的小盒子,只要把各种参数和设定往里面一扔,你想要的仿真结果数据就会自动掉落。——这可能是亿万仿真研发工程师的梦
国家统计局:2024年一季度国内生产总值初步核算结果
原标题:国家统计局:2024年一季度国内生产总值初步核算结果根据有关基础资料和国内生产总值(GDP)核算方法,经初步核算,我国2
北京协和医院:患者APP开启“互联网+”就医新体验
一、案例概要为深入贯彻落实习近平主席新时代中国特色社会主义思想和党的十九大精神,推进实施健康中国战略,提升医疗卫生现代化
五大关键词 解读政策利好(图)
漫画:牛力5月,省政府出台首批支持中小微企业发展的15条财政措施。措施一经发布,立即在社会上引起广泛关注。这些措施出台的背
本企业新闻