明略科技何敏:生成式營銷落地的六個體系架構思維與三個前沿方向
2024-10-28
10月11日,明略科技集團副總裁、大模型基礎架構負責人何敏,在2024第八屆營銷科學大會上了發表《生成式營銷必備的體系架構思維和前沿方向》主題演講,深入分享了生成式營銷落地的六個體系架構思維與三個前沿方向。
本文目錄如下:
01 生成式營銷落地的六個體系架構思維:
02 生成式營銷的三個前沿方向:
過去一年,很多企業做了大量嘗試,我們和企業交流時發現一個問題:做demo的時候“一馬平川”,一周就可以出效果,但真正落地的時候“舉步維艱”,半年都上不了線。為了解決這類問題,大家的共識是:生成式營銷的落地需要體系架構思維。
在人人都可以搭建大模型智能體的時代,上傳一個產品文檔,寫一個prompt,大模型的回答可以做到精準無比。當產品從一個變成十個時,大模型就從精準無比變成了胡言亂語。這是什么原因造成的呢?
一句話概括,信息濃度決定問答準確率。
只有一個產品時,單一產品信息濃度是100%;十個產品時,單一產品信息濃度會被稀釋為10%。當問到A產品信息時,其它產品還會來“搗亂”,大模型的準確率自然而然就下降了。
通過上面的例子,我們可以思考,精準問答場景,適合采用合庫思維,還是分庫思維?
合庫思維是指把所有的產品放到一個知識庫;分庫思維是指把A產品放在A的知識庫,B產品放在B的知識庫,A產品的問題到A知識庫找,B產品的問題到B知識庫找。顯然,分庫思維更適用于精準問答場景。
當品牌方進行雙十一活動策劃時,需要用到各種知識庫,比如秒針系統有Media的知識庫,Social的知識庫,電商、私域、線下廣告的知識庫。合庫思維更適用于創意探索場景,更容易找到創新點,生成的報告也會更加完整。
總的來說,數據的組織形式,決定了業務效果。
與此同時,數據的提取形式,也決定了業務效果。
以知識問答為例,一種方式是長文本問答,另一種方式是檢索增強問答。
長文本問答,指把100頁的文檔丟給大模型直接回答;檢索增強問答,指從100頁的文檔中提取2頁與問題相關的信息丟給大模型。如何在這兩種方式中選擇?主要依賴于企業的業務場景。
長文本問答方式,更適合全文總結場景。比如總結100頁文檔的核心信息,或分析本周周報與上一周相比的進展。
檢索增強問答方式,則適用于精準問答。比如100頁的產品手冊中包含產品介紹、功效、使用方法、原理、注意事項、售后服務等。當用戶咨詢產品功效時,只需找到相關的2頁丟給大模型,無需閱讀100頁。它的優點是準確率更高,且成本更低。因為如果閱讀100頁信息,其它98頁對相關的2頁內容反而會產生干擾。
提到思考系統,我們可以聯想到最近爆火的OpenAI o1模型。OpenAI o1模型在美國數學奧林匹克 (AIME) 預選賽中躋身美國前500名學生之列,在競爭性編程問題(Codeforces)中百分位排名是89%,并在物理、生物和化學問題 (GPQA) 基準測試中超越人類博士級水平。
為什么它會獲得這樣好的成績?原因是o1采用了體系思考的模式。在訓練與推理階段,思考計算的時間越長,模型的準確率就會越高。
同時,o1模型的發布將《思考:快與慢》這本書帶入大眾視野。書中提到人類有兩種思考模式,分別是系統1和系統2。系統1指的是快思考,類似于直覺思考;系統2指的是慢思考,是有意識、深思熟慮的思考。就像我們解最后一道數學大題時,要理解問題、分析問題、拆解步驟,進行推理,才能得出答案。
接下來,我們就來介紹與思考系統相關的體系思維。
還是從最簡單的選擇題開始。讓大模型執行分類任務,判斷帖子屬于ABCD哪一類,是做大模型應用的常見問題。
通過實驗,我們發現一個非常有趣的現象:如果先選擇結論后分析原因,大模型的答案往往飄忽不定,結論選A,分析后的答案選C;如果先分析原因后選擇結論,分析與結論往往一致。這是什么原因造成的?
回到剛才提到的思考系統,人類在做一道選擇題時,系統1的思維模式是下意識地先給結論,告訴你這道題肯定選A;當我們采用系統2的思維,一步步拆解后會發現答案應該選C。
所以結論的不一致是因為我們的大腦進行了系統1與系統2思維模式的切換。大模型也是類似的道理。基于分析給出結論,答案的一致性、可靠性會更好,因為始終處在同一個系統思維模式里。
我們經常收到企業市場部的需求,洞察100篇帖子中的內容策略。最簡單的做法是黑盒分析,把這些帖子都丟給大模型。這樣做的好處是速度快,可以做定性分析;缺點是可解釋性較差,難以給出結論背后的原因。
另一種做法是白盒分析,同樣把100篇帖子丟給大模型,但不輸出總結,而是先輸出ABCD等所有特征,然后通過小模型采用聚類分析的方法統計ABCD哪些權重更高,最后再輸出內容策略。白盒分析的好處是可解釋、可回溯。大模型給出的結果基于ABCD權重最高的元素而產生,并且還能找到ABCD的原帖進行分析。因此,白盒分析更適合做定量、可解釋、可回溯的分析。
前面我們講到數據的組織形式、提取形式決定了業務的最終效果。同樣地,只有確定了業務目標,才能更好地定義效果、數據與訓練方法。所以,業務優先、目標優先,是更加落地的方式。相比平臺式的規劃,在實戰中,我們通常建議企業優先選擇單點。
在幫助企業客戶落地的過程中,我們有四層單點應用的業務目標。
上午場明略科技集團創始人、董事長兼首席執行官吳明輝提到了奧運營銷大學生素人發帖的例子,這些學生利用明略科技提供的SocialGrow、SocialX、小明助理等AI工具,通過挖掘奧運熱點來指導創作方向,在生成海量內容后,從中挑選出優質帖發布,并進行了監測與調優,形成了一個正向的創作循環。
整個過程共計發布了1237篇帖子,總互動量23萬+,爆帖率15%。值得注意的是,一些學生的粉絲只有幾十個,但小紅書單帖互動最高做到了7萬+,抖音單帖最高互動做到了6000+。
通過上面的例子可以看出,分析和生成結合起來更重要。分析的產出可以作為生成的輸入,帶來更好的內容效果。這也是InsightFlow CMS(洞察驅動的內容管理平臺)背后的思考邏輯。
生成式營銷有很多前沿的研究主線,其中一條,我們可以沿著OpenAI o1模型的思路進行探索。o1的發布引用了OpenAI的一篇文章《Let’s Verify Step by Step》。這篇文章提出了兩種獎勵機制,結果監督的獎勵機制和過程監督的獎勵機制。
通過這兩種獎勵機制,o1模型在數學領域有了大幅提升。我們認為,這兩種監督獎勵方式對生成式營銷的研究也有啟發。圍繞這個思路,我們將闡述以下三個生成式營銷的前沿研究方向。
這一研究方向主要借鑒明略科技在ACMMM,以及Adobe在ICLR人工智能頂會發布的論文,闡述未來大模型輸出結果的豐富性。
目前,大模型輸入的內容形態有視頻、語音、文本,輸出的主要是文本,未來在營銷領域會有怎樣的變化?
通過引入感觀指標、效果指標,我們在豐富大模型輸出維度的同時,還可以輔助企業優化內容策略。
這一方向主要借鑒Google DeepMind 8月發表的兩篇文章。
基于過程監督獎勵的驗證器,類似媽媽陪我寫作業場景。相當于在生成大模型Generator的基礎上(想象成“孩子寫作業大模型”),引入一個新的大模型Verifier(想象成“媽媽陪讀大模型”)。這個Verifier盯著Generator輸出時,不僅看結果,還能指出每一步的對錯。因此,基于Verifier的過程監督,生成大模型Generator的成績就很容易得到提高。
什么叫作最優過程探索策略?
舉個例子,生成大模型Generator這個“孩子”解不出題,困在迷宮里了,怎么辦?可以一下子變成七個葫蘆娃兄弟分身,用不同的思路去解。最厲害的是它還結合了“媽媽陪讀大模型”Verifier,可以監督每一步,幫助孩子在迷宮里找到最優策略。打個比方,大娃走了這條路走不通,媽媽就可以告訴二娃,這條路走不通了,繼續找新的路,直到七娃最后走出迷宮,這就是最優解。
應用到營銷領域,這個Verifier相當于營銷策劃的智囊團,當營銷的Generator提供各種營銷策劃方案時,Verifier可以幫助我們驗證營銷的策略、數據、邏輯關系等,同時找到最佳的營銷策略或方法。比如一筆預算到底選哪些渠道,哪類圈層人群,采用何種內容策略,有成千上萬種組合,可以在ROI里找到最優的路徑。
這一方向主要借鑒斯坦福大學的STaR和Quiet-STaR兩篇文章。STaR是Self-Taught Reasoner的縮寫,是自學推理過程。
我們繼續前面的比喻,媽媽陪我寫作業寫了1億次,我變成葫蘆娃兄弟走迷宮走了1億次,我們便積累了1億次的自我反思以及1億次多角度探索的過程經驗數據。我們可以使用這些過程數據,用來訓練大模型Generator,提升“孩子”的體系思考能力。當生成大模型自己學會獨立思考之后,就不需要媽媽指導,不需要其他六個兄弟同時做好多遍題找最終的答案,而是在每次解題過程中進行自我反思和多角度思考,再輸出最終答案。這個過程我們稱作思維的內隱化,它形成的思維鏈叫作隱式思維鏈。再通俗一點,這就是內功心法的修煉過程。
應用到營銷領域,營銷大模型可以學習行業和企業的各種決策經驗,包括各種A/B Test經驗數據,從而給出更加落地的答案。此時的大模型就像沉淀了行業最佳實踐、企業多年實戰經驗和體系架構思維的掃地僧,即使簡單輸出幾十token,實際上威力無窮、效果炸裂。因為每一個token輸出的背后都進行了大量思考和計算,其他大模型難以與之相比。類似奧運營銷發帖的例子,素人大學生在體系思考的大模型內功心法加持下,也能一招打出成千上萬的互動效果。
內力凝精髓,普招也暴擊!
信息填寫