快娛樂 內容中心
你是否曾因影片內容太長而失去耐心,或在複雜的教學中迷失方向,只能無奈地反覆拖動時間軸?根據近期報導,Google正悄悄在YouTube導入一項由AI模型Gemini驅動的殺手級功能,它讓觀眾能直接「開口」與影片對話,徹底顛覆了傳統的觀看體驗。
這項新功能以一個「詢問」(Ask)按鈕的形式出現在影片播放器下方。根據Android Police的報導,點擊後會展開一個聊天視窗,使用者可以在此輸入任何關於影片的問題,或是直接選用「總結這部影片」等建議提示。
想像一下,當你觀看一場長達數小時的講座,卻不小心分心錯過了關鍵段落。過去你只能費力地來回尋找,但現在只需簡單提問:「這部分的主要論點是什麼?」Gemini便會提供附有時間戳的重點摘要,讓你瞬間跟上進度,無須重看整個片段。
這不僅僅是生成一份冰冷的文字記錄。根據使用者回饋,這項互動功能完全改變了觀影的本質。它將單向的「接收資訊」轉變為雙向的「探索知識」。無論是要求解釋影片中的專業術語,還是快速抓取核心結論,都讓學習與資訊吸收的效率大幅提升。
這項功能的推出,也呼應了Google在今年初發布的「個人智慧」(Personal Intelligence)概念。根據Google官方部落格,其目標是讓Gemini深度整合進旗下各項應用程式中,包括Gmail、Google Photos以及YouTube,從而提供更具情境感知、更個人化的主動協助。
這背後的技術核心,是Gemini強大的多模態理解能力。根據Data Studios的分析,AI能處理影片中的文字、聲音與視覺元素,解析字幕與逐字稿,從而精準掌握內容脈絡並回答相關提問。 這使得AI不再只是猜測,而是真正「看懂」了影片。
除了YouTube內建的功能,這股AI摘要風潮也催生了第三方工具。例如,一款近期更新的Chrome瀏覽器擴充功能,同樣利用Gemini技術,讓使用者在電腦上也能一鍵生成任何YouTube影片的摘要、逐字稿與關鍵洞察。



