更新時間:2023-05-26 來源:黑馬程序員 瀏覽量:
BERT是谷歌公司提出的預(yù)訓(xùn)練模型,主要模擬語言模型和語句預(yù)測。由12層transformer的編碼器羅列組成,可以進(jìn)行遷移學(xué)習(xí)從而滿足不同要求任務(wù),也可以用來進(jìn)行詞向量生成。
Bert是一個預(yù)訓(xùn)練模型,bilstm是一個模型結(jié)構(gòu)。首先兩個結(jié)構(gòu)不同,bert是基于transformer改進(jìn)而來引入多頭注意力機制等,bilstm是一個時間序列的模型包含遺忘門、輸入門、輸出門、細(xì)胞狀態(tài)。
Bert中利用了attention,在谷歌論文中 attention is all you need
中提出了多頭注意力和transformer,bert是由12層transformer的編碼器羅列組成。

關(guān)于Q,K,V:Q可以理解為一段文本,K 可以理解為關(guān)鍵詞提示,V可以理解為模型學(xué)習(xí)后對文本關(guān)鍵部分的理解。在模型訓(xùn)練時,K
V由編碼器給出,Q由解碼器給出,模型根據(jù)Q以及K學(xué)習(xí)理解文本的關(guān)鍵含義得到V。
1024首播|39歲程序員逆襲記:不被年齡定義,AI浪潮里再迎春天
2025-10-241024程序員節(jié)丨10年同行,致敬用代碼改變世界的你
2025-10-24【AI設(shè)計】北京143期畢業(yè)僅36天,全員拿下高薪offer!黑馬AI設(shè)計連續(xù)6期100%高薪就業(yè)
2025-09-19【跨境電商運營】深圳跨境電商運營畢業(yè)22個工作日,就業(yè)率91%+,最高薪資達(dá)13500元
2025-09-19【AI運維】鄭州運維1期就業(yè)班,畢業(yè)14個工作日,班級93%同學(xué)已拿到Offer, 一線均薪資 1W+
2025-09-19【AI鴻蒙開發(fā)】上海校區(qū)AI鴻蒙開發(fā)4期5期,距離畢業(yè)21天,就業(yè)率91%,平均薪資14046元
2025-09-19