- 标签:
- leetcode (55)
- algorithm (54)
- array (14)
- LLM (10)
- backtrack (7)
- DP (7)
- binary-tree (6)
- graph (6)
- example (4)
- queue (4)
- stack (4)
- linked list (3)
- DFS (3)
- transformer (2)
- BFS (2)
- math (2)
- document (1)
- introduction (1)
- attention (1)
- BERT (1)
- BST (1)
- sort (1)
- greedy (1)
- CLI (1)
- Tool (1)
🚀
语言模型是序列的概率分布,自回归模型基于之前生成的结果生成token。信息理论中的熵衡量编码所需的比特数,n-gram模型依赖于最后的n-1个token,神经网络的引入使得语言模型取得重要进展,尤其是RNN和Transformers的应用。