上海传英信息技术有限公司

       传音控股致力于为新兴市场的消费者提供智能终端产品和移动互联网服务,于2019年科创板首批企业上市。上海传英信息技术有限公司(以下简称“传英信息”)是传音控股布局全球在上海的研发总部同时在深圳,重庆设有研发中心,海外多地有用户研究和消费者洞察团队。传英信息先后被认定上海高新办认定的国家高新企业、上海市软件企业、浦东新区企业研发机构、浦东新区区域性总部、上海市企业技术中心等。

公司秉持“Think Globally,Act Locally”(全球化视野、本地化执行)的理念,将技术创新作为公司核心战略之一,以“用户需求”和“前沿技术”为创新的双驱动,从构建数据、算法、算力三方向能力入手,以关键技术落地应用为目标,建立起技术研发创新机制,将大数据、云计算、互联网等软件技术与移动终端产品深度结合,打造人工智能深肤色影像关键技术研发平台;结合行业技术发展趋势及在新兴市场积累的大量用户基础、数据资源,传音在人工智能语音识别和视觉感知、深肤色拍照算法、智能充电和超级省电、云端系统软件、智能数据引擎、5G通信等领域,开展了大量符合当地用户使用习惯的科技创新研究

传英信息也不断向外拓展,深化产学研合作,广泛与知名院校及老师、研究所、供应链等,基于通讯、游戏、语意、视频等等展开合作、提升基础研究实力。

        欢迎国内外学者加盟浦东新区博士后创新实践基地,携手“传英信息参与到“一带一路”沿线国家经济体建设,输出中国技术,中国力量。

课题1:基于人工智能技术的计算摄影画质增强

研究内容:主要研究基于深度学习的图像画质增强算法。可以选择研究如下技术方向之一:研发高分辨率图像的超分辨率算法;研发特定图像语义的清晰度提升算法;研发图像去模糊算法;研发暗夜光环境图像提亮降噪算法;研发AI-ISP全链路图像处理算法。
研究目标在基于深度学习的画质增强技术上达到业界领先水平,对影像画质的增强优于当前已商用的传统图像处理算法。成果能落地转化到传音手机影像业务中。

1. 学术研究成果发表在顶级期刊、会议上;

2. 参与该领域的国际交流和国际竞赛;

3. 围绕关键领域,产出核心专利;

4. 研发的算法模型在性能上能基本满足高端芯片平台移动终端的商用要求。

 

课题2:多口音大语种与低资源小语种语音识别算法研究

研究内容

1.非母语、多地口音下的大语种语音识别(非洲各国口音的英、法语);

2.相对低资源、无发音字典的小语种语音识别(非洲小语种);

3.code switch场景下的语音识别,语种识别;

4.回声、强噪声、人声干扰等复杂场景下的识别率提升;

5.大规模弱标签数据下的识别率提升;

6.海量实体资源下的热更新语音识别框架。

研究目标:

1.顶级会议发表上述相关课题论文1-2篇;

2.带队参加连续语音识别、关键词检测、语音活动检测等相关国际知名赛事并得奖;

3.研究适合语料资源、当地口音、语言特点的语音识别算法,并依托公司提供的大量语料,构建上述各场景下识别率行业领先的语音识别产品(针对当地口音、语种)。

 

课题3:高清视频的实时增强技术

研究内容:主要研究1080p及以上的高清视频流的实时增强技术,可以选择如下技术方向之一:视频防抖技术,多路视频HDR技术,视频夜景降噪技术,低带宽环境视频流的人脸高清重建技术,视频插帧技术等。

研究目标:通过对视频相关技术开展探索,突破视频处理主客观质量与计算效率天花板。研发的算法模型在性能上能基本满足高端芯片平台移动终端的商用要求(实时处理帧率达到25fps),对视频的处理效果达到或者优于当前市场上已商用的图像处理算法。在学术研究方面,发表相关领域顶会顶刊论文,或者参与相关的国际竞赛;在知识产权方面,撰写提交相关国际国内发明专利。

 

课题4:复杂场景下的语音前端全链条算法研究

研究内容:

1.基于单麦、双麦、多麦、麦阵在复杂、恶劣场景下的语音前处理算法(声源定位、语音降噪、回声消除、增益控制、说话人分离、语音增强);

2.相对低资源、多种非母语口音下的一二级语音唤醒算法;

3.声纹识别(跨设备声纹,声纹自学习,文本无关声纹识别)

研究目标:

1.顶级会议发表上述相关课题论文1-2篇;

2.带队参加语音前处理、声纹识别等相关国际知名赛事并得奖;

3.复杂场景(如风噪、雨噪、极低信噪比下)下的语音前处理算法研究达到前沿先进水平,有效提升远场拾音效果、解决语音分离问题,并最终提升后端识别的准确率;

4.固定词语音唤醒率达到98%以上,误唤醒率压测下 < 72小时1次;

5.声纹识别具备跨设备迁移、随用户状态不断自学习的能力,文本无关声纹达到行业先进水平。

课题5:高性能多帧图像配准技术和图像融合技术

研究内容:主要研究多帧图像亚像素级配准技术,多帧图像融合技术。实现基于多帧图像的画质增强技术,如高动态HDR算法、降噪算法、图像细节增强、图像去模糊;或者实现基于多摄像头系统的画质增强技术,如高动态HDR算法、降噪算法、图像细节增强。

研究目标通过研究多帧图像、多摄像头系统的高性能高精度的配准技术和融合技术,构建基于多帧的画质提升支撑技术,并进一步实现面向多视多帧、YUV或RAW域的降噪、HDR合成、细节增强、超分,去模糊等复杂算法,构建行业领先的商用移动终端高效算法库,研发的算法模型在性能上能基本满足高端芯片平台移动终端的商用要求,对图像的处理效果达到或者优于当前市场上已商用的图像处理算法。在学术研究方面,发表相关领域顶会顶刊论文;在知识产权方面,撰写提交相关国际国内发明专利。

 

课题6:多语种对话系统自然语言处理算法研究

研究内容:研究英语、法语以及非洲本地小语种的自然语言处理算法,应用于面向非洲的语音助手中并搭载在传音智能硬件设备上,提升AI对话系统的对话智能度。具体来说,包括以下内容:

1. 研究多语言对话系统中的自然语言生成、情感计算、用户画像、个性化回复等算法;

2. 研究多语种的机器翻译算法(含冷启动阶段多种低资源小语种);

3. 研究对话系统中情感陪伴、开放域闲聊模块(英、法语为主)

4. 研究文本摘要生成算法(英、法语为主);

5. 研究通用域知识问答系统的构建与优化(英、法语为主);

6. 阅读场景下的NLP文本结构化分析(角色个数、风格设定、角色状态和情感预测、文本环境预测等)。

研究目标:

1.顶级会议发表上述相关课题论文1-2篇;

2.带队参加国际知名赛事并得奖;

3.构建用户体验行业领先的对话系统,具备一定的人设设定,具备情感计算框架,具备情感陪伴与开放域闲聊的能力,用户与闲聊系统的平均单次对话达到15轮以上;

4.构建低资源语种机器翻译系统,性能与效率均达到行业先进水平并落地产品;

5.构建文本摘要系统,在大语种上达到业界先进水平并落地;在小语种上达到领先水平并应用落地;

构建领先无监督、半监督学习能力,并支撑语音助手、智能客服等场景的数据分析、洞察。