0%

应用场景

  在自然语言处理的场景下,顺序关系至关重要,比如“我请你吃饭”与“你请我吃饭”,这两句话虽然构成的单词相同,但是其表达的意义却是截然相反。目前较为火热的卷积神经网络(CNN)主要处理图片中像素值之间的空间关系,不能捕获输入的时序信息,而循环神经网络(RNN)对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,利用了RNN的这种能力,使深度学习模型在解决语音识别、语言模型、机器翻译以及时序分析等NLP领域的问题时有所突破。

  举个简单的例子
  第一句话:I like eating apple!(我喜欢吃苹果!)
  第二句话:The Apple is a great company!(苹果是一家很棒的公司!)

  现在的任务是要给apple打Label,我们都知道第一个apple是一种水果,第二个apple是苹果公司,假设我们现在有大量的已经标记好的数据以供训练模型,当我们使用全连接的神经网络时,我们做法是把apple这个单词的特征向量输入到我们的模型中,在输出结果时,让我们的label里,正确的label概率最大,来训练模型,但我们的语料库中,有的apple的label是水果,有的label是公司,这将导致模型在训练的过程中,预测的准确程度取决于训练集中哪个label多一些,这样的模型对于我们来说完全没有作用。问题就出在了我们没有结合上下文去训练模型,而是单独的在训练apple这个单词的label,这也是全连接神经网络模型所不能做到的,于是就有了我们的循环神经网络。

阅读全文 »

seq2seq模型

seq2seq本质上是一种encoder-decoder的框架,最典型的应用就是机器翻译问题,模型先使用编码器对源语言进行编码,得到固定长度的编码向量,然后在对该编码向量进行解码,得到对应的翻译语言向量。因为输入和输出都是序列数据,因此又被称为sequence-to-sequence,简称seq2seq,目前应用最多的编码解码器是RNN(LSTM,GRU),但编码解码器并不仅限于RNN。

阅读全文 »

论文原文地址:https://cleverbobo.github.io/file/hmp.pdf
仅供学术交流使用~

摘要

The problem of predicting human motion given a sequence of past observations is at the core of many applications in robotics and computer vision. Current state-of-the-art formulate this problem as a sequence-to-sequence task, in which a historical of 3D skeletons feeds a Recurrent Neural Network (RNN) that predicts future movements, typically in the order of 1 to 2 seconds. However , one aspect that has been obviated so far , is the fact that human motion is inherently driven by interactions with objects and/or other humans in the environment.
In this paper , we explore this scenario using a novel context-aware motion prediction architecture. We use a semantic-graph model where the nodes parameterize the human and objects in the scene and the edges their mutual interactions. These interactions are iteratively learned through a graph attention layer , fed with the past observations, which now include both object and human body motions. Once this semantic graph is learned, we inject it to a standard RNN to predict future movements of the human/sand object/s. We consider two variants of our architecture, either freezing the contextual interactions in the future of updating them. A thorough evaluation in the “Whole-Body Human Motion Database” [29] shows that in both cases,our context-aware networks clearly outperform baselines in which the context information is not considered.

翻译:
  在智能机器人和计算机视觉的许多应用中,根据过去的一系列对人类动作的观察结果来预测人体运动是一个核心问题。目前,主要应用Seq2Seq技术来处理相关的领域,其中采用3D骨骼(人行为动作的抽象表达方式)作为历史输入,为循环神经网络(RNN)提供信息从而预测未来的运动。这个未来的时间段通常控制在1到2秒的时间内。然而,到目前为止,有一个观点已被人们否定——人类的运动从本质上来说,是由与环境中的物体或其他人的互动所驱动的。

阅读全文 »

简介

卷积神经网络主要是对图片进行处理,比如说人脸识别等等。该种算法参考了人眼视觉的某些特性,利用某些特殊的卷积核对图像进行处理分割。下面,我将对卷积神经网络的来源,架构,优化,优劣以及应用等方面进行简单介绍。

引言

在2012年,卷积神经网络第一次正式投入使用,Alex Krizhevsky曾使用该网络赢得2012年的图像识别竞赛,并将该网络错误率从0.26降到0.15,这在当时是一个非常巨大的进步。目前,卷积神经网络仍是一种非常流行深度学习算法,该算法使用特殊的卷积核对图片进行处理,提取一些高维特征,然后对这些高维特征的处理以达到我们的目的,所以这种方法用于处理图像方面的问题事非常有效!

阅读全文 »

简介

本篇blog是基于python的bp神经网络代码实现,本身没有借助任何包,主要是想对该算法进行一个深入了解。基于马疝病数据集的一个二分类,结构相对简单,准确性不是很高,但是对神经网络的深入理解有很大的启发

阅读全文 »

简介

  本篇blog将介绍神经网络的入门基础——深度感知机,简单介绍下深度感知机的结构,分析数据是如何前馈的,误差又是如何后馈,即误差如何反向传播,这是神经网络优化算法的核心。

背景介绍

  神经网络的灵感取自于生物上的神经元细胞,如下图所示:

  这是人体神经元的基本构成,其中树突主要用于接收其他神经元的信号,轴突用于输出该神经元的信号,数以万计的神经元相互合作,使得我们人类能够进行高级的思考,能够不断地对新事物进行学习。因此,我们就希望仿照人类神经网络的结构,搭建一种人为的神经网络结构,从而使其能够完成一些计算任务,这也是神经网络名字的由来。

阅读全文 »