LLM

Key takeaways

  • Large Language Model - được huấn luyện dựa trên khối lượng khổng lồ các văn bản, sách, báo, …
  • Mục tiêu: dự đoán từ kế tiếp trong câu. Ví dụ: “Có một con mèo ngồi trên …” mô hình dự đoán sẽ trả về “ghế”, “cửa”, “nệm”, ..
  • Kiến trúc cốt lõi: Transformer - Nó gồm các thành phần chính:
    • Embedding - biến từ ngữ thành các vector số.
    • Self-Attention - Cơ chế chú ý, giúp mô hình hiểu được mqh giữa các từ trong câu. Ví dụ: Em bé nhìn bầu trời vì nó có màu xanh. - “Nó” liên quan tới bầu trời, chứ không phải “em bé”. - Links - An Intuition for Attention | Jay Mody
    • Layers: Hàng chục đến hàng trăm lớp để học các mức ý nghĩa từ đơn giản (ngữ pháp), đến phức tạp (logic, ngữ cảnh).
  • Mỗi từ trong câu tiếp theo được mô hình tính toán xác suất. Nó chọn từ có khả năng cao nhất, hoặc lấy mẫu ngẫu nhiên để tạo tính tự nhiên.
  • Tinh chỉnh (Fine-tuning) & RLHF
    • Sau khi được huấn luyện cơ bản, LLM được tinh chỉnh bằng dữ liệu chuyên biệt (ví dụ: y khoa, pháp luận, lập trình, …)
    • RLHF - Reinforcement Learning from Human Feedback - huấn luyện mô hình theo phản hồi của con người để trả lời hữu ích, an toàn và lịch sự hơn.

Notes

LLM giống như một “bộ não số” học cách bắt chước ngôn ngữ con người, rồi dùng toán xác suất và cấu trúc Transformer để dự đoán từ tiếp theo.

  • LLM là stateless - Bản thân nó chỉ có thể xử lý được với ngôn ngữ, chứ không có khả năng duyệt web, đọc file, …
    • Ngoài “LLM là bộ não”, người ta nghĩ ra “chân tay” là các tools để mở rộng khả năng của LLM. Ví dụ: Tool duyệt web. Từ prompt của user + mô tả của tool duyệt web, LLM trả về thông tin, yêu cầu execute tool duyệt web, sau đó client execute, lấy thông tin, trả lại cho LLM để nó tiếp tục bóc tách kết quả, generate ra response cho người dùng.

Evolution

  1. Basic LLMs (2022): Text-only, no external capabilities
  2. Tool Integration (2023): Function calling, plugin systems
  3. Agent Frameworks (2024): Multi-tool workflows, autonomous operation
  4. Standardization (2024+): MCP, unified protocols

LLM-extend.excalidraw

Source:

Ví dụ với MCP Obsidian + Claude Code

  • Config xong thì có thể thấy 1 list functions ở trong mục Tools
  • Khi hỏi đáp trên Claude Code LLM trả về nội dung Gợi ý sẽ sử dụng hàm nào Tạo new file Call HTTP để tạo file

Todo

  • Check LLM articles trên ByteByteGo, Youtube, blogs