ICML论文精选：无监督学习的研究和应用“新京葡萄京”

发布时间：2024-02-03 人气：

本文摘要：深度自学的类型按照数据否有标记来区别可以分成三种：监督自学、半监督自学和无监督自学。事实上人类不有可能把每件事都手把手的教给AI。无监督自学应当才是未来的趋势。 ICML给无监督自学分开进了一个专区，还包括无监督自学的研究和应用于。我们今天主要来注目一下无监督自学应用于方面的论文。

新京葡萄京

深度自学的类型按照数据否有标记来区别可以分成三种：监督自学、半监督自学和无监督自学。事实上人类不有可能把每件事都手把手的教给AI。无监督自学应当才是未来的趋势。

ICML给无监督自学分开进了一个专区，还包括无监督自学的研究和应用于。我们今天主要来注目一下无监督自学应用于方面的论文。深度映射的无监督聚类分析（Unsupervised Deep Embedding for Clustering Analysis）聚类分析对许多数据驱动的应用领域来说十分最重要，并且早已以距离函数和分组算法的表现形式被普遍完全的研究过了。而探讨于聚类分析的自学展现出的研究相对来说则较为较少。

这篇论文，我们明确提出了一个深度嵌入式聚类方法（Deep Embedded Clustering，DEC），它可以用于深度神经网络构建同时自学特征回应和聚类任务。这种方法在图像和文本语言识别领域的实验中的展现出比现今最差的方法都有明显的提高。用作检查数据的马尔可夫调制标记的泊松过程（Markov-modulated Marked Poisson Processes for Check-in Data）论文创建了一个时间倒数的概率模型来研究由时间和方位构成的“通过检查点（check-in）”的轨迹数据。

我们将数据组织成一种标记点变化进程的构建，并且是一种由马卡洛夫冲刺进程（Markov jump process，MJP）条结果的反感的标记分布式排序。论文也将通过给每个用户分配一个“优先地点”的方式将用户异质性考虑到了模型之中。还通过退出“Bag of words”（忽视掉文本的语法和语序，用一组无序的单词来传达一段文字或者一个文档的方法）假设和在倒数时间中继续执行的方式拓展了潜在狄利克雷产于的考虑到。分层填充泊松分解成（Hierarchical Compound Poisson Factorization）分层泊松分解成（HPF）早已被证明在极端稠密的引荐系统中具备很好的扩展性。

但是由于稠密系统和号召模型的密切耦合特性容许了后者的传达丰富性。本文讲解了一种分层填充泊松分解成函数（Hierarchical Compound Poisson Factorization，HCPF），既有较好的泊松伽马架构，与高维极端稠密矩阵比起又同时具备HPF较好的扩展性。这个新的算法经过了九个线性型和三个连续型数据集的测试，都指出HCPF在捕猎稠密度和号召之间的关系的性能高于HPF。在单细胞的基因表达数据校正技术变化的狄利克雷过程混合模型（Dirichlet Process Mixture Model for Correcting Technical Variation in Single-Cell Gene Expression Data）论文讲解了一种单细胞基因数据传达的递归标准和聚类方法。

新兴的细胞RNA编码技术可以容许人们找到和叙述关于细胞的很多信息。但是现在的数据很更容易被实验的错误结果或者细胞特性的叙述偏差影响。目前的解决问题方法：研究生物信号前再行继续执行总体的误差缺失，并无法彻底解决问题。

论文明确提出的模型由分层贝叶斯混合模型和细胞特异性规模的因素构成，用来协助数据的反复递归和聚类，辨别确切由生物信号产生的技术误差。并且证明了这种方法要比现行的方法更加有优势。

多时间序列的非参数关系重返模型的自动建构（Automatic Construction of Nonparametric Relational Regression Models for Multiple Time Series）论文创建了两个涉及的、可以通过寻找造成变化的联合因素同时处置三组时间序列数据的核心自学方法。这种自学方法对现实中一些数据集作出了更为准确的模型创建。

解决问题了之前系统精确度、特异性和叙述准确度过于的问题。人类的自学应当归属于半监督自学和无监督自学的融合。因此这两种领域的研究都很有注目的价值。

原创文章，予以许可禁令刊登。下文闻刊登须知。

本文关键词：ICML,论文,精选,无,监督,学习,的,研究,和,应用,新京葡萄京

本文来源：新京葡萄京-www.agentangkasnet303.com