计算机视觉
让计算机更好地理解真实世界,并拥有创造可视内容的能力。研究方向:超大规模图象分类/语义分割/描述生成,人像剖析/检测/跟踪/识别/3D建模/生成,视频内容剖析/分类/缩略/描述生成/搜索/推荐。
语音技术
致力于音频讯号高效高质量采集声音识别算法源代码,增强,传输,回放;致力于让机器能用语音与人进行更自然的交互。研究方向:音频编解码,麦克风阵列远场讯号处理,语音分离与提高,声纹识别,语音识别,语音/歌声合成,语音转换。
自然语言处理
赋予计算机系统以自然语言文本形式与外界交互的能力声音识别算法源代码,追踪和研究最前沿的自然语言文本理解和生成技术,孵化下一代自然语言处理技术与商业应用场景。研究方向:文本理解、文本生成、智能对话、机器翻译。
机器学习
从数据中手动剖析并学习规律,并借助规律对未知数据进行预测。研究方向:机器学习理论,元学习,联邦学习,图深度学习,生成学习,序列学习,自动化机器学习,强化学习等。