2026年1月、情報学部の植木一也准教授が北海道札幌市において開催されたコンピュータビジョンと計算知能分野の国際会議 CVCI 2026(7th International Conference on Computer Vision and Computational Intelligence)において招待講演を行いました。
本講演では、「Next-Generation Video Retrieval: Multimodal Intelligence for Accurate and Interactive Search」と題し、近年急速に発展している視覚言語モデル(Vision-Language Models:VLMs)を活用した次世代の映像検索技術について紹介しました。
従来のテキストと映像の単純な対応付けにとどまらず、マルチモーダルモデルの推論能力と生成能力を活かすことで、検索精度の向上に寄与する複数の最新技術について解説しました。
講演後には、多くの参加者から質問や意見が寄せられ、今後の共同研究や実応用を見据えた展開に関する議論にも発展するなど、本研究分野への関心の高さがうかがえました。
今後も、検索精度の向上にとどまらず、対話型映像理解システムの実現に向けた研究開発を進め、成果を順次公開していく予定です。