百度Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用户以“拿来即用”的方式进行文本分类、文本聚类、个性化推荐等多种场景的调研和应用。考虑到主题模型训练成本较高以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和落地。
原文网址:https://github.com/baidu/Familia
原文网址:https://github.com/baidu/Familia
责任编辑:黄焱林
为您推荐
CCTV网络传播中心主任汪文斌发言
中央电视台网络传播中心主任汪文斌发言尊敬的杜百川总工程师,尊敬的何宗就副台长,尊敬的沈向君总经理,各位领导,各位来宾,各位女士,先生们,早上好!非常非常感谢BIRTV组委会,非常非常感谢何宗就副台长给我这样一个机会,到这里面介绍CCTV.COM,本来介绍中央电视台新业务应该由何宗就副台长在这个地方跟各位做介绍,但是何宗就副台长特别给予我,给我们CCTV.COM,非常充分表现出我们中央电视台台领导对我们新业务关心支持与厚爱,所以在这里面非常感谢。CCTV.COM背后是中央电视台网络传播
BIRTV2009主题报告将全程语音同步直播
2009年8月26-29日,由国家广播电影电视总局主办,中央电视台承办的第十八届北京国际广播电影电视设备展览会(IRTV2009),在北京中国国际展览中心举行。DVBCN数字电视中文网做为本届展览会的支持媒体,将系统播报本次展会的盛况。8月25日,BIRTV2009主题报告会在北京国际饭店举行,DVBCN数字电视中文网全程同步语音直播。今年BIRTV的“主题报告会”将围绕高清电视的发展、新媒体与新业务、下一代广播电视网络等话题展开,与会的广电总局领导和权威人士将带来更多新话题和新理念,继续彰显高规格、大信息量的特点,共同探讨我国广播电视发展前景带来的新机遇、新挑战和应对措施。今年BIRTV的“