>>>
搜索结果: 1-15 共查到LDA相关记录24条 . 查询时间(0.233 秒)
基于Web服务发现方法通常是将Web服务聚在某一个固定的功能类中,导致该Web服务的其余功能特性被忽略,Web服务的资源利用率降低的问题,提出一种基于LDA和模糊C均值的Web服务多功能聚类方法。首先,从ProgrammableWeb.com网站上爬取Web服务数据,并抽取Web服务描述文档;其次,使用LDA主题模型对Web服务描述文档进行建模,获得包含不同功能信息的文档主题矩阵;最后,在文档主题...
为高效地发现满足用户需求的Web服务,针对Web服务的描述文本较短、缺乏足够有效信息的问题,提出一种基于Word2Vec和LDA主题模型的Web服务聚类方法。该方法首先将Wikipedia语料库作为扩充源,使用word2vec对Web服务描述文档内容进行扩充,再将扩充后的描述文档利用主题模型进行特征建模,将短文本主题建模转化为长文本主题建模,更准确地实现服务内容主题表达,最后根据文档的主题分布矩阵...
主题情感混合模型(Reverse-Joint Sentiment/Topic Model;Joint Sentiment/Topic Model)能够有效地同时抽取文档的主题和情感信息,在情感分析领域受到广泛的关注,因为没有考虑整体分布与局部分布的关系,导致分类效果不佳且不稳定.本文同时考虑两个粒度上的情感/主题分布——文档级和局部,提出多粒度的主题情感混合模型(MG-R-JST;MG-JST)....
针对传统K-means算法初始聚类中心选择的随机性可能导致迭代次数增加、陷入局部最优和聚类结果不稳定现象的缺陷,提出一种基于隐含狄利克雷分布(LDA)主题概率模型的初始聚类中心选择算法。该算法选择蕴含在文本集中影响程度最大的前m个主题,并在这m个主题所在的维度上对文本集进行初步聚类,从而找到聚类中心,然后以这些聚类中心为初始聚类中心对文本集进行所有维度上的聚类,理论上保证了选择的初始聚类中心是基于...
本文主要关注多视图数据的分类问题.考虑到集成分类方法可组合多个弱分类器构成一个强分类器,以及主题模型能学习复杂数据的语义表示,本文试图将集成学习思想引入主题模型中,以便同时学习多视图数据的分类规则和预测性语义特征.具体地,结合概率主题模型LDA模型和集成分类方法Softmax混合模型,提出了一个多视图有监督的分类模型.基于变分EM方法,推导了该模型的参数估计算法.两个真实图像数据集上的实验结果表明...
LDA为基础,系统梳理新兴主题探测以及主题趋势探测技术中的LDA以及其他LDA改进主题模型的发展现状。介绍LDA的变分推导和Gibbs抽样两种参数推导算法;总结近年来LDA模型的改进,包括对主题演化建模的主题模型、对文档内容和元数据联合建模的模型、采用在线式学习的主题模型及将LDA和引文分析相结合的主题演化方法等,并对不同的改进模型进行深入对比和分析;梳理NIH-VB、TIARA、VxInsig...
提出了基于图像欧氏距离(IMED, IMage Euclidean distance)和直接线性判别分析(DLDA, direct linear discriminant analysis)的改进Isomap算法——IMED-Isomap+DLDA。该算法针对Isomap对图像噪声和形变顽健性较差的特点,引入了图像欧氏距离代替传统欧氏距离,并针对Fisher线性判别在人脸识别中可能会出现小样本问题...
对信号的特征选择与分类问题进行研究,提出了一种基于核主分量分析(kernel principle component analysis, KPCA)和线性判别(linear discriminant analysis, LDA)分类器的信号调制识别算法。针对通信信号的特点,首先利用KPCA的方法对特征参数进行主分量组合,以消除信号特征间的相关性和压缩特征向量的维数,然后利用LDA分类器进行信号调制...
线性鉴别分析是特征抽取中最为经典和广泛使用的方法之一。基于人脸的一种直观自然特性——镜像对称性,提出一种算法——对称线性鉴别分析。该算法引入镜像变换,生成镜像样本,依据奇偶分解原理,生成镜像奇、偶对称样本,并分别提取各奇偶样本的对称鉴别特征。理论分析与实验证明,该算法合理地利用了镜像样本,既扩大了样本容量,又提高了人脸识别率。
基于LDA模型的主题分析     LDA模型  文本分割  Gibbs抽样        2009/12/28
在文本分割的基础上, 确定片段主题, 进而总结全文的中心主题, 使文本的主题脉络呈现出来, 主题以词串的形式表示. 为了分析准确, 利用LDA (Latent dirichlet allocation)为语料库及文本建模, 以Clarity度量块间相似性, 并通过局部最小值识别片段边界. 依据词汇的香农信息提取片段主题词, 采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外, 尝试挖掘...
为解决视觉语言特征提取这个唇读技术中最关键的难题,提出一种新的基于DCT和LDA的特征提取方法。为提取对不同口型最具分类能力的特征矢量,首先基于DCT对视觉语言部位变换降维,然后基于LDA算法从DCT系数提取对口型分类性能最优的特征矢量。在特定人与非特定人的唇读数据库上以及实时唇读识别的实验都表明,该方法唇读识别率比传统的人工直接选择DCT系数法以及PCA提取法有明显提高。
为了提高彩色人脸识别的性能,提出了一种非负矩阵分解与线性判别分析相结合的彩色人脸识别算法。首先采用非负矩阵分解算法对彩色人脸图像不同颜色通道的信息进行编码,计算彩色人脸图像空间的基图像;然后根据非负矩阵分解计算得到的图像分解系数,融入人脸对象的类别信息,采用线性判别分析算法计算最优的鉴别子空间;最后以彩色人脸图像的投影系数为特征,采用最近邻分类算法进行人脸识别。在CVL和CMU PIE人脸数据库上...
直接线性鉴别分析(DLDA)是一种以克服小样本问题而提出的LDA扩展方法,被声明利用了包含类内散布矩阵零空间外的所有信息。然而,很多反例表明事实并非如此。为了更深入地了解DLDA的特性,该文从理论上对其进行了分析,得出结论:基于传统Fisher准则的DLDA几乎没利用零空间,将丢失一些有用的鉴别信息;而基于广义Fisher准则的DLDA,若满足一定条件(在高维小样本数据应用中一般都满足)且最优鉴别...
垃圾邮件处理是一项长期研究课题,越来越多的文本分类技术被移植到垃圾邮件处理应用当中。LDALatent Dirichlet Allocation)等topic模型在自动摘要、信息获取和其他离散数据应用中受到越来越多的关注。将LDA模型作为一种特征选择方法,引入垃圾邮件处理应用中。将LDA特征选择方法与质心+KNN分类器结合,得到简单的测试用垃圾邮件过滤器。初步实验结果表明,基于LDA的特征选择方...
提出了一种新的基于图像分块重构和线性判别分析相融合的方法,主要用于人脸识别。该方法通过计算两幅图像之间图像块的重构均值误差,运用线性判别分析求出两幅图像降维后的欧式距离,融合重构误差和欧式距离计算这两幅图像之间的差别程度。识别过程中,待测图像与训练图像中差别最小的认为是属于同一个人。该方法在ORL人脸数据集上进行实验,并在PIE数据集上验证了其有效性。新方法能够有效克服光照变化、平移等影响,在识别...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...