Sora爆火!多模態技術如何影響營銷洞察?
2024-03-26
前段時間,Sora的橫空出世,標志著文生視頻大模型的突破性進展,進一步帶動了多模態技術的熱度。
所謂多模態技術,涉及機器學習和人工智能領域,可以處理和分析文本、圖像、音頻、視頻等多種數據類型,并利用不同數據類型間的互補信息,提升模型的理解、分析和預測能力。從初期的單一模態分析,到模態融合,再到當前的廣泛應用與優化,已展現出巨大的潛力和廣闊的應用前景。
在營銷領域,不僅僅是視頻生成,利用多模態強大的視頻解析能力,解決日益增長的視頻類內容洞察,是當下品牌主更值得關注的核心場景。
隨著社媒熱點、圈層、表達方式的快速變化,品牌要想獲得消費者的認可,往往需要對消費者進行更細顆粒度的分析,挖掘出潛在需求。在社媒洞察的初始環節,標簽標注是否全面準確,會影響到后面一系列營銷決策的判斷。
秒針系統將標簽劃分為穩定標簽與趨勢標簽兩大類型。
穩定標簽:與產品品質、質量、功效定義相關的內容標簽,此類標簽相對穩定,不易改動
趨勢標簽:與當期社媒平臺內容流行趨勢、熱點話題、消費者需求相關的內容標簽
傳統的數據解析,要經歷人工讀帖、抽取帖子、訓練模型,再到對齊為一個固定屬性值的過程。這個固定的屬性值被稱為穩定標簽,如產品品質、質量、功效等,優點是標準化、覆蓋面廣、可復用程度高,但同時也存在個性化方面的局限,部分細節信息難以被保留下來。
多模態大模型擁有海量參數,具有強大的泛化能力。基于多模態大模型識別出來的趨勢標簽可以反映出當前的流行趨勢、熱點話題、消費者需求,說法泛化更廣,敞口更大,既保留了“原汁原味”的表述,又能夠靈活滿足不同品牌多維度、個性化的分析需求。在場景方面,對穩定標簽作出了有益補充。
針對音頻、文字等顯性信息較少的視頻,多模態技術能夠從多個維度科學提煉出畫面中的隱含信息。相比人工分析,更加全面、系統,更能確保一致性。在強調品牌調性的創意視頻解析中,可以發揮出巨大價值。
以下畫面展示了一位女性在雪地里和哈士奇犬互動的場景:
一位女性在雪地里和哈士奇犬互動(圖片由小明助理Copilot生成)
根據常規的解析方式,可以得出基于畫面本身的顯性信息:
包含元素:女性,哈士奇犬,雪地,被雪覆蓋的樹木
具體季節:冬季
構圖邏輯:圖像中心為一位穿著冬季服裝的女性和一只哈士奇犬,兩者位于畫面的前景,背景是密集的雪覆蓋的樹木,構成了一種自然和諧的構圖
色彩搭配:圖像以白色(雪)和深色(女性的服裝和狗的毛發)為主,形成了鮮明的對比
通過明略多模態大語言模型進行解析,在顯性信息提取的基礎上,繼續下鉆,還可實現對隱含信息/開放性特征的識別:
拍攝手法:使用了柔和的光線和較低的視角,可能使用了淺景深來突出前景主體,背景清晰卻不搶眼,營造出一種寧靜的感覺
象征意義:圖像可能象征著人與自然的和諧共處,或者強調了冬季的純凈與寧靜
整體氛圍:圖像傳達出一種平和、寧靜的氛圍,同時也有一種親近自然和動物的溫馨感
我們再以OpenAI Sora大模型官方展示的視頻?”一名女子漫步在東京街頭“ 進行解析:
一名女子漫步在東京街頭(視頻由Sora生成,此處僅為截圖展示)
常規解析要素:
人物元素:女性,時尚,皮夾克,紅色裙子,黑色高跟鞋,墨鏡,耳環,黑色手提包
背景元素:繁忙的城市,霓虹燈和商店招牌,雨后濕潤的街道,高樓和各種商店,很多行人
季節元素:春季或秋季,考慮到女性的著裝和濕潤的街道,這兩個季節的天氣比較適合穿皮夾克,且可能會有雨
構圖邏輯:視頻構圖集中在女性主體上,她位于畫面的中心,走在街道的一側;攝影師可能使用了對稱或引導線的構圖技巧,利用街道的線條和城市的燈光引導觀眾的視線;女性的位置和姿態在每個畫面中都有所變化,展現了她在街道上行走的動態
色彩搭配:以對比鮮明的暖色和冷色為主,女性的紅色衣物與周圍藍色調的夜景形成對比;背景的霓虹燈提供了豐富的色彩,增添了都市的活力
明略多模態大語言模型挖掘到的隱含要素:
拍攝手法:視頻可能使用了穩定器或手持穩定拍攝技術,保持畫面的平穩;攝影師可能使用了淺景深來突出主體,使背景稍微模糊,從而聚焦于女性
象征意義:視頻可能在象征城市生活的快節奏和時尚感;女性的自信步伐和時尚的打扮可能代表了現代都市人的生活態度和個性表達
整體氛圍:視頻營造了一種充滿活力的都市夜景氛圍;女性的時尚造型和背后繁華的街道共同傳達了一種現代、時尚、充滿活力的都市生活感覺
進入到洞察環節,基于多模態技術全面、深度的解析,在對不同特征進行聚類的過程中,由于前期保留了多樣化的細節描述,品牌往往能發現令人驚喜的“Aha時刻”,收獲意想不到的新鮮洞察。在品牌賣點同質化嚴重的情況下,找到打動消費者的新故事。
某品牌在洞察“學生黨”群體時,通過大模型聚類,得到“眼袋掉到下巴”、“美國作息”等多種來自用戶真實生活的鮮活描述,側面反映出該群體經常熬夜。品牌便可以進一步感知到,“學生黨”在某一特定階段,存在緩解疲勞、改善睡眠等訴求,從而以更接近消費者需求、心理的場景切入,開展接下來的營銷動作,為營銷決策提供科學支撐。
通過多維度特征的交叉、融合,多模態大模型能夠進一步形成“場景豐富”“具象生動”的用戶畫像故事,為海量爆款內容生成打好地基,讓每一個從消費者那里聽到的聲音,再次抵達消費者心靈,真正解決用戶最迫切的需求。
從執行效率來看,以往采用人工模式一個月才能完成的分析與洞察,在多模態大模型的助力下,一周即可快速完成,準確率更高,且可回溯。
明略多模態大語言模型能力展示
超預期,可落地,更迅速的執行效果,意味著多模態技術將成為品牌快速讀懂消費者的關鍵,由技術驅動的品牌將更快搶占先機。
明略科技旗下秒針系統,依托18年來沉淀下來的大量營銷數據與行業經驗,與多模態技術實現創新融合,對營銷鏈路中的各個環節進行了全面的優化與重塑。從人群發現、分析、聚類,到內容生成,已形成完整的閉環。目前,在美妝行業已率先落地。在生成式營銷的浪潮下,明略科技將助力更多品牌抓住新技術帶來的寶貴機會,實現精準營銷和業務增長。
信息填寫