一種白皮書生成方法、裝置、設備及存儲介質
2021-11-02
本申請提供了一種白皮書生成方法、裝置、設備及存儲介質,其中,該方法包括:將目標文本作為關鍵詞抽取模型的輸入數據,得到至少一個關鍵詞;將各關鍵詞作為話術生成模型的輸入數據,得到至少一個話術模板;針對每個話術模板中的每個待填充位置,根據各歷史關鍵詞在該待填充位置處出現的詞頻,將在各關鍵詞中確定的第一關鍵詞填充至該待填充位置,以得到目標話術文本;針對每個目標話術文本包括的每個目標字詞,根據歷史字詞在目標白皮書模板的各段落主題下出現的頻率,將該目標話術文本填充至與其匹配度最高的段落主題下,以得到目標行業的白皮書;通過上述方法,有利于降低人工工作量和人工成本。
一種白皮書生成方法,其特征在于,包括:將獲取到的至少一個目標文本作為關鍵詞抽取模型的輸入數據,得到從各所述目標文本中確定的至少一個關鍵詞,其中,所述目標文本為用于描述目標行業的文本,所述關鍵詞為所述目標文本中出現的詞頻大于或者等于預設閾值的詞語;將關鍵詞組作為話術生成模型的輸入數據,得到為所述關鍵詞組匹配的至少一個話術模板,其中,所述關鍵詞組包括各所述關鍵詞;針對每個話術模板中的每一個待填充位置,根據各歷史關鍵詞在該待填充位置處出現的詞頻,在所述關鍵詞組中確定第一關鍵詞,其中,與所述第一關鍵詞相同的歷史關鍵詞所對應的第一詞頻大于或者等于與第二關鍵詞相同的歷史關鍵詞所對應的第二詞頻,所述第二關鍵詞包括所述關鍵詞組中除所述第一關鍵詞之外的其他關鍵詞,各所述歷史關鍵詞包括在至少一個歷史白皮書中確定的關鍵詞,各所述歷史白皮書針對的行業領域與所述目標行業所屬的行業領域相同;將所述第一關鍵詞填充至該待填充位置,以得到目標話術文本;針對每一個目標話術文本包括的每一個目標字詞,根據與該目標字詞相同的歷史字詞在目標白皮書模板的各段落主題下出現的頻率,確定該目標話術文本與各段落主題的匹配度,其中,所述目標字詞是通過對該目標話術文本進行分詞處理得到的,所述歷史字詞是通過對至少一個歷史話術文本進行分詞處理得到的,各所述歷史話術文本包括:在各所述歷史白皮書中位于各所述段落主題下的文本,所述目標白皮書模板針對的行業領域與所述目標行業所屬的行業領域相同;將該目標話術文本填充至與其匹配度最高的段落主題下,以得到所述目標行業的白皮書。
申請號:CN202110894357.9
申請(專利權)人:北京明略軟件系統有限公司
公開日期(公開):2021.09.07
公開日期(授權):2021.11.02
信息填寫