Google Cloud อัปเดตความสามารถให้ Text-to-Speech ได้หลายภาษามากขึ้น
Google ได้ประกาศอัปเดตความสามารถให้ AI รองรับการทำ Text-to-Speech ได้หลายภาษามากขึ้น รวมถึงจำนวนของเสียงเพิ่มขึ้นด้วย
ความสามารถที่ Google ได้ประกาศอัปเดตให้ Text-to-Speech มีดังนี้
- เพิ่มภาษาใหม่ 7 ภาษาคือ Danish, Portuguese/Portugal, Russian, Polish, Slovakian, Ukrainian และ Norwegian Bokmål นั่นทำให้เทคโนโลยีดังกล่าวสามารถรองรับการทำงานได้ถึง 21 ภาษาแล้ว
- เพิ่มจำนวนเสียงมาตรฐานถึง 21 เสียงและ WaveNet 31 เสียง (คือการใช้ Deep Neural Network ไปเรียนรู้เสียงต่างๆ มาเพื่อสร้างเสียงที่เป็น Natural มากขึ้นกว่าเสียงมาตรฐาน) โดยเทคโนโลยีนี้ถูกคิดค้นจาก DeepMind นั่นเอง ทำให้ตอนนี้มีจำนวนเสียงถึง 106 เสียง
- เปิดให้ฟีเจอร์ Device Profile หรือความสามารถให้ผู้ใช้ปรับแต่งการเล่นเสียงกับฮาร์ดแวร์ต่างๆ กันเป็นสถานะพร้อมใช้งาน
ในฝั่งของเทคโนโลยี Speech-to-Text ก็มีการเพิ่มความสามารถด้วยเช่นกัน เช่น ปรับให้ Premium model for Video and Enhancement phone เข้าสู่สถานะพร้อมใช้งาน(เทคโนโลยีคล้ายกับที่ใช้แสดงซับในยูทูป) ซึ่งมีความแม่นยำมากขึ้น รวมถึงประกาศความสามารถในการแยกแยะเสียงผู้พูดหลายคน (multi-channel recognition) เข้าสู่สถานะพร้อมใช้งานเช่นกัน
Comments
Post a Comment