Please enable JavaScript.
Coggle requires JavaScript to display documents.
新聞大事件 (新聞到事件 (步驟1: 新聞轉向量 (TF-IDF, word2vec, LDA, doc2vec, BERT, glove),…
新聞大事件
新聞到事件
步驟1: 新聞轉向量
TF-IDF
word2vec
LDA
doc2vec
BERT
glove
步驟2: 向量轉事件
Hierachical clustering
threshhold觀察與選擇
k-means
步驟0: 斷詞
word-based: jieba + 自訂詞庫
char-based + n-gram
事件到關鍵字(與權重/爆發力)
TF-IDF
詞性
兜出我們的「爆發力」公式
從事件找相關事件or相關新聞
做法1: 使用關鍵字重疊最高的
做法2: 使用上面找出的vec算相似度最高的 (需要確保跨天vec向量空間意義相同)
事件分類到predefined tag (火力、核能...)
做法1: 把目前的資料夾當tag,訓練文章分類器
從事件中選代表新聞1篇
做法1: 取最靠近事件中心點的新聞
找出最容易代表事件/新聞的一句話
做法1: 直接用新聞標題就好
前端推播(LINE)