Google Cloud อัปเดตความสามารถให้ Text-to-Speech ได้หลายภาษามากขึ้น

Google ได้ประกาศอัปเดตความสามารถให้ AI รองรับการทำ Text-to-Speech ได้หลายภาษามากขึ้น รวมถึงจำนวนของเสียงเพิ่มขึ้นด้วย
ความสามารถที่ Google ได้ประกาศอัปเดตให้ Text-to-Speech มีดังนี้
  • เพิ่มภาษาใหม่ 7 ภาษาคือ Danish, Portuguese/Portugal, Russian, Polish, Slovakian, Ukrainian และ Norwegian Bokmål นั่นทำให้เทคโนโลยีดังกล่าวสามารถรองรับการทำงานได้ถึง 21 ภาษาแล้ว
  • เพิ่มจำนวนเสียงมาตรฐานถึง 21 เสียงและ WaveNet 31 เสียง (คือการใช้ Deep Neural Network ไปเรียนรู้เสียงต่างๆ มาเพื่อสร้างเสียงที่เป็น Natural มากขึ้นกว่าเสียงมาตรฐาน) โดยเทคโนโลยีนี้ถูกคิดค้นจาก DeepMind นั่นเอง ทำให้ตอนนี้มีจำนวนเสียงถึง 106 เสียง
  • เปิดให้ฟีเจอร์ Device Profile หรือความสามารถให้ผู้ใช้ปรับแต่งการเล่นเสียงกับฮาร์ดแวร์ต่างๆ กันเป็นสถานะพร้อมใช้งาน
ในฝั่งของเทคโนโลยี Speech-to-Text ก็มีการเพิ่มความสามารถด้วยเช่นกัน เช่น ปรับให้ Premium model for Video and Enhancement phone เข้าสู่สถานะพร้อมใช้งาน(เทคโนโลยีคล้ายกับที่ใช้แสดงซับในยูทูป) ซึ่งมีความแม่นยำมากขึ้น รวมถึงประกาศความสามารถในการแยกแยะเสียงผู้พูดหลายคน (multi-channel recognition) เข้าสู่สถานะพร้อมใช้งานเช่นกัน



Comments

Popular posts from this blog

นักวิจัยปล่อยโค้ดที่ทำให้เกิดจอฟ้ากับเครื่อง Windows จำนวนมากบน GitHub

ผู้เชี่ยวชาญพบมัลแวร์ใช้ Windows BITS เพื่อติดต่อเซิร์ฟเวอร์ควบคุม

รู้สาเหตุแล้ว ประเทศในแถบเอเชียตะวันออกเฉียงใต้เน็ตช้าเพราะสายเคเบิลใต้ทะเลขาด