暂时不更新,留个坑位,要是有人催更就更,估计也没人看~
生成式对抗神经网络(待更新)
最近不想更新,暂时留个坑,以后更新~
变分自编码器(待更新)
暂时不想更新,先留个坑,不定期会补上~
自编码器(待更新)
暂时断更,不定期更新,看心情~
循环神经网络
应用场景
在自然语言处理的场景下,顺序关系至关重要,比如“我请你吃饭”与“你请我吃饭”,这两句话虽然构成的单词相同,但是其表达的意义却是截然相反。目前较为火热的卷积神经网络(CNN)主要处理图片中像素值之间的空间关系,不能捕获输入的时序信息,而循环神经网络(RNN)对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,利用了RNN的这种能力,使深度学习模型在解决语音识别、语言模型、机器翻译以及时序分析等NLP领域的问题时有所突破。
举个简单的例子
第一句话:I like eating apple!(我喜欢吃苹果!)
第二句话:The Apple is a great company!(苹果是一家很棒的公司!)
现在的任务是要给apple打Label,我们都知道第一个apple是一种水果,第二个apple是苹果公司,假设我们现在有大量的已经标记好的数据以供训练模型,当我们使用全连接的神经网络时,我们做法是把apple这个单词的特征向量输入到我们的模型中,在输出结果时,让我们的label里,正确的label概率最大,来训练模型,但我们的语料库中,有的apple的label是水果,有的label是公司,这将导致模型在训练的过程中,预测的准确程度取决于训练集中哪个label多一些,这样的模型对于我们来说完全没有作用。问题就出在了我们没有结合上下文去训练模型,而是单独的在训练apple这个单词的label,这也是全连接神经网络模型所不能做到的,于是就有了我们的循环神经网络。
通俗理解Seq2Seq模型+Attention机制(待修正)
解析论文《Context-aware Human Motion Prediction》
论文原文地址:https://cleverbobo.github.io/file/hmp.pdf
仅供学术交流使用~
摘要
The problem of predicting human motion given a sequence of past observations is at the core of many applications in robotics and computer vision. Current state-of-the-art formulate this problem as a sequence-to-sequence task, in which a historical of 3D skeletons feeds a Recurrent Neural Network (RNN) that predicts future movements, typically in the order of 1 to 2 seconds. However , one aspect that has been obviated so far , is the fact that human motion is inherently driven by interactions with objects and/or other humans in the environment.
In this paper , we explore this scenario using a novel context-aware motion prediction architecture. We use a semantic-graph model where the nodes parameterize the human and objects in the scene and the edges their mutual interactions. These interactions are iteratively learned through a graph attention layer , fed with the past observations, which now include both object and human body motions. Once this semantic graph is learned, we inject it to a standard RNN to predict future movements of the human/sand object/s. We consider two variants of our architecture, either freezing the contextual interactions in the future of updating them. A thorough evaluation in the “Whole-Body Human Motion Database” [29] shows that in both cases,our context-aware networks clearly outperform baselines in which the context information is not considered.
翻译:
在智能机器人和计算机视觉的许多应用中,根据过去的一系列对人类动作的观察结果来预测人体运动是一个核心问题。目前,主要应用Seq2Seq技术来处理相关的领域,其中采用3D骨骼(人行为动作的抽象表达方式)作为历史输入,为循环神经网络(RNN)提供信息从而预测未来的运动。这个未来的时间段通常控制在1到2秒的时间内。然而,到目前为止,有一个观点已被人们否定——人类的运动从本质上来说,是由与环境中的物体或其他人的互动所驱动的。