P H A M T H I Y E N

Văn bản thành Giọng nói

Giới thiệu tổng quan

Phát triển và kiểm thử hệ thống Tổng hợp tiếng nói (Text-to-Speech) tiếng Việt với khả năng hỗ trợ đa vùng miền, đa giới tính và biểu cảm cảm xúc, đảm bảo độ tự nhiên và độ chính xác cao khi chuyển đổi văn bản thành giọng nói.

  • Nhận diện giọng nói đa vùng miền
  • Xử lý được tiếng Việt 3 miền
  • Hỗ trợ tiếng Anh và ngôn ngữ trộn Việt – Anh
  • Tự động ngắt nghỉ thông minh theo ngữ cảnh
  • Xử lý chính xác từ viết tắt & thuật ngữ chuyên ngành
  • Nhận diện hội thoại đa người
  • Ổn định trong môi trường nhiều tạp âm
  • Nhận diện chuỗi số dài & mã định danh chính xác
Thời gian phát triển
02/2025 - 05/2025
Đội nhóm
3 thành viên tham gia
Hệ thống
Website
Lĩnh vực
AI – Xử lý tiếng nói (Speech AI)

Mục tiêu dự án

  • Xây dựng hệ thống TTS tiếng Việt hỗ trợ đa vùng miền (Bắc – Trung – Nam).
  • Phát triển giọng nói đa giới tính với khả năng tùy chọn linh hoạt.
  • Nâng cao độ tự nhiên và biểu cảm cảm xúc trong từng ngữ cảnh sử dụng.
  • Đảm bảo độ chính xác cao khi xử lý số, tiền tệ, ký hiệu, văn bản Việt–Anh trộn.
  • Tối ưu hiệu suất và độ trễ để tích hợp vào hệ thống Voice AI thực tế.

Vai trò

  • Thiết kế bộ test theo ngữ cảnh sử dụng
  • Kiểm thử xử lý văn bản đầu vào
  • Đánh giá độ tự nhiên và độ giống giọng
  • Kiểm thử cảm xúc và ngữ điệu
  • Xây dựng tiêu chí đánh giá định lượng
  • Phân tích lỗi và đề xuất cải tiến

Kịch bản kiểm thử

Testcase

Báo cáo/Thống kê

Dự án liên quan