报告题目: 跨媒体智能:检索、生成与推理
报告时间:2022年06月09日(周四)下午15:00
报告地点:必发集团全部平台首页楼A501;腾讯会议:822-523-074
报告人: 彭宇新 北京大学
报告摘要:随着多媒体和互联网技术的迅猛发展,图像、视频、文本、音频等多媒体大数据快速增长。它们多源异构且相互关联,使得信息检索、数据生成、推理决策面临跨源、跨域、跨媒体等重要挑战。如何借鉴人脑的跨媒体处理特性,跨越视觉、语言等不同感官信息来感知和认知外部世界,对于提高计算机的智能水平至关重要。本报告将介绍我们的近期研究工作,包括跨媒体检索、视觉-语言相互生成、视觉常识推理等,并进行相关系统展示。
报告人简介:
彭宇新,北京大学二级教授、博雅特聘教授、国家杰出青年科学基金获得者、国家万人计划科技创新领军人才、科技部中青年科技创新领军人才、863项目首席专家、中国人工智能产业创新联盟专家委员会主任、中国工程院“人工智能2.0”规划专家委员会专家、北京图象图形学学会副理事长、中国图象图形学学会会士、副秘书长、提名与奖励委员会副主任。主要研究方向为跨媒体分析与推理、图像视频识别与理解、计算机视觉、人工智能。以第一完成人获2016年北京市科学技术一等奖和2020年中国电子学会科技进步一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然科学基金重点等20多个项目,发表论文160多篇,包括ACM/IEEE Trans和CCF A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TCSVT等期刊编委。