P H A M T H I Y E N

Giọng nói thành Văn bản

Giới thiệu tổng quan

Phát triển và kiểm thử hệ thống Chuyển đổi giọng nói thành văn bản (Speech-to-Text) tiếng Việt, hỗ trợ đa vùng miền và nhận diện ngôn ngữ Anh–Việt, đảm bảo độ chính xác cao và khả năng xử lý hội thoại thực tế.

  • Giọng nói AI đa vùng miền
  • Hỗ trợ đa giới tính linh hoạt
  • Biểu cảm tự nhiên, chân thực
  • Ngữ điệu mượt mà, cảm xúc
  • Đọc chính xác nội dung phức tạp
  • Xử lý tốt số liệu & ký hiệu
  • Tối ưu trải nghiệm người dùng
  • Nâng cao hiệu quả hệ thống Voice AI
Thời gian phát triển
03/2025 - 06/2025
Đội nhóm
3 thành viên tham gia
Hệ thống
Website
Lĩnh vực
Xử lý tiếng nói (Speech AI)

Mục tiêu dự án

  • Xây dựng hệ thống TTS tiếng Việt hỗ trợ đa vùng miền (Bắc – Trung – Nam).
  • Phát triển giọng nói đa giới tính với khả năng tùy chọn linh hoạt.
  • Đảm bảo ngắt nghỉ câu và dấu câu tự nhiên.
  • Tối ưu độ chính xác trong môi trường thực tế (nhiễu, tốc độ nói nhanh/chậm).
  • Sẵn sàng tích hợp vào hệ thống chatbot, Voice AI.

Vai trò

  • Kiểm thử độ chính xác nhận diện giọng nói
  • Kiểm thử đa ngữ & Việt–Anh trộn
  • Kiểm thử số liệu, ký hiệu & đơn vị đo lường
  • Kiểm thử ngữ cảnh hội thoại thực tế (đa - đơn)
  • Kiểm thử hiệu năng & môi trường âm thanh
  • Phân tích lỗi & đề xuất cải tiến mô hình

Testcase

Báo cáo/Thống kê