机读格式显示(MARC)
- 000 01990nam0 2200265 450
- 010 __ |a 978-7-03-051885-9 |d CNY58.00
- 099 __ |a CAL 012017064764
- 100 __ |a 20170424d2017 ekmy0chiy50 ea
- 200 1_ |a 信念网络在话题识别与追踪中的应用研究 |A Xin Nian Wang Luo Zai Hua Ti Shi Bie Yu Zhui Zong Zhong De Ying Yong Yan Jiu |f 吴树芳, 朱杰著
- 210 __ |a 北京 |c 科学出版社 |d 2017
- 215 __ |a 144页 |c 图 |d 24cm
- 320 __ |a 有书目 (第137-144页)
- 330 __ |a 向量空间检索模型在话题识别与追踪领域的成功应用,从理论上证明用于信息检索的贝叶斯网络模型亦可用于该领域。信念网络模型属于基于贝叶斯网络的检索模型的一种,专著围绕该思想,将其用于话题识别与追踪模型的构建,为该领域提出新的研究方法。考虑到新闻报道的特殊性,在文本处理阶段,将在基本互信息的基础上,提出融合聚类思想和时间距离的新闻话题特征选择方法,用于计算新闻报道中术语的权重。为了获得每个话题的初始特征子集规模,给出基于类内距离最小、类间距离最大的目标函数,并采用坐标下降法对其求解结合信念网络模型和新闻报道的特点,给出四个基于信念网络的话题模型BSTM-I、BSTM-II、BDTM-I和BDTM-II。BSTM-I、BSTM-II属于静态话题模型,其区别是节点层数、类型。BDTM-I属于动态话题模型,节点类型和弧的意义与静态模型相同,不同的是在话题追踪过程中,其术语层会随着话题的发展而不断更新,包括术语权重的更新和术语节点的插入、删除。以上三个话题模型沿用了传统建模思想,具备和以往模型相同的优缺点。BDTM-II打破传统建模的思想,运用信念网络模型提供了一个灵活框架的优势,将术语节点分为两类:初始核心术语节点和更新术语节点,并采用析取手段将它们作为两类证据进行归并。依据模型的拓扑结构、贝叶斯概率和条件独立性假设给出了上述四个话题模型的概率推导。最后,专著将在上述内容的基础上,进行基于信念网络的话题模型优化研究,以期进一步提高模型的综合性能。
- 606 0_ |a 网络检索 |A Wang Luo Jian Suo
- 701 _0 |a 吴树芳 |A Wu Shu Fang |4 著
- 701 _0 |a 朱杰 |A Zhu Jie |4 著
- 801 _0 |a CN |b NMU |c 20170424
- 905 __ |a AUSTL |d G254.92/W747