メインコンテンツまでスキップ

Azure OpenAI Service: Hướng dẫn Toàn diện

1. Giới thiệu

Azure OpenAI là gì?

Là dịch vụ cung cấp các mô hình AI mạnh nhất thế giới (GPT-4, DALL-E 3) của OpenAI, nhưng chạy trên hạ tầng của Microsoft Azure.

Khác gì với ChatGPT (openai.com)?

  • ChatGPT: Dành cho người dùng cá nhân. Dữ liệu chat của bạn có thể được dùng để train AI.
  • Azure OpenAI: Dành cho Doanh nghiệp.
    • Bảo mật: Dữ liệu của bạn KHÔNG bao giờ được dùng để train AI cho người khác.
    • Riêng tư: Chạy trong VNet của bạn.
    • SLA: Cam kết thời gian hoạt động (Uptime).

2. Các khái niệm cốt lõi

Model (Mô hình)

Là bộ não AI.

  • GPT-4: Thông minh nhất, hiểu ngữ cảnh sâu. Đắt và chậm.
  • GPT-3.5 Turbo: Nhanh, rẻ. Đủ dùng cho Chatbot thông thường.
  • DALL-E: Vẽ tranh từ văn bản.
  • Whisper: Chuyển giọng nói thành văn bản.

Deployment

Bạn không gọi trực tiếp vào Model. Bạn phải tạo một "Deployment" cho Model đó.

  • Ví dụ: Tạo deployment tên my-gpt4-app sử dụng model gpt-4.

Token

AI không đọc chữ cái, nó đọc Token.

  • 1 Token $\approx$ 0.75 từ tiếng Anh (hoặc 1 từ tiếng Việt ngắn).
  • Giá tiền tính theo Token (Input Token + Output Token).

3. RAG (Retrieval Augmented Generation)

Đây là kỹ thuật hot nhất hiện nay: "Chat với dữ liệu của bạn".

GPT-4 rất giỏi, nhưng nó không biết về tài liệu nội bộ công ty bạn. Làm sao để nó trả lời câu hỏi về quy định nghỉ phép của công ty?

  1. Retrieval (Tìm kiếm): Khi user hỏi, hệ thống tìm các văn bản liên quan trong kho tài liệu công ty (dùng Azure AI Search).
  2. Augmented (Bổ sung): Ghép câu hỏi của user + văn bản vừa tìm được.
  3. Generation (Tạo câu trả lời): Gửi tất cả cho GPT-4. "Dựa vào văn bản này, hãy trả lời câu hỏi...".

-> Kết quả: AI trả lời chính xác dựa trên dữ liệu riêng, không bịa đặt (Hallucination).