Azure OpenAI Service: Hướng dẫn Toàn diện
1. Giới thiệu
Azure OpenAI là gì?
Là dịch vụ cung cấp các mô hình AI mạnh nhất thế giới (GPT-4, DALL-E 3) của OpenAI, nhưng chạy trên hạ tầng của Microsoft Azure.
Khác gì với ChatGPT (openai.com)?
- ChatGPT: Dành cho người dùng cá nhân. Dữ liệu chat của bạn có thể được dùng để train AI.
- Azure OpenAI: Dành cho Doanh nghiệp.
- Bảo mật: Dữ liệu của bạn KHÔNG bao giờ được dùng để train AI cho người khác.
- Riêng tư: Chạy trong VNet của bạn.
- SLA: Cam kết thời gian hoạt động (Uptime).
2. Các khái niệm cốt lõi
Model (Mô hình)
Là bộ não AI.
- GPT-4: Thông minh nhất, hiểu ngữ cảnh sâu. Đắt và chậm.
- GPT-3.5 Turbo: Nhanh, rẻ. Đủ dùng cho Chatbot thông thường.
- DALL-E: Vẽ tranh từ văn bản.
- Whisper: Chuyển giọng nói thành văn bản.
Deployment
Bạn không gọi trực tiếp vào Model. Bạn phải tạo một "Deployment" cho Model đó.
- Ví dụ: Tạo deployment tên
my-gpt4-appsử dụng modelgpt-4.
Token
AI không đọc chữ cái, nó đọc Token.
- 1 Token $\approx$ 0.75 từ tiếng Anh (hoặc 1 từ tiếng Việt ngắn).
- Giá tiền tính theo Token (Input Token + Output Token).
3. RAG (Retrieval Augmented Generation)
Đây là kỹ thuật hot nhất hiện nay: "Chat với dữ liệu của bạn".
GPT-4 rất giỏi, nhưng nó không biết về tài liệu nội bộ công ty bạn. Làm sao để nó trả lời câu hỏi về quy định nghỉ phép của công ty?
- Retrieval (Tìm kiếm): Khi user hỏi, hệ thống tìm các văn bản liên quan trong kho tài liệu công ty (dùng Azure AI Search).
- Augmented (Bổ sung): Ghép câu hỏi của user + văn bản vừa tìm được.
- Generation (Tạo câu trả lời): Gửi tất cả cho GPT-4. "Dựa vào văn bản này, hãy trả lời câu hỏi...".
-> Kết quả: AI trả lời chính xác dựa trên dữ liệu riêng, không bịa đặt (Hallucination).