毛球球 (@maoqiuqiu)我觉得transformer架构完全可以为聋哑人做一些事情。 中发帖

我突然在想transformer底层是预测,那是不是聋哑人能够通过默念,识别唇语,结合语境,再通过tts将声音输出出去。 
即便唇语的识别可能不太精准,但transformer不就是为此服务的吗。 
识别:“我想。。饭。。果” 
通过transformer识别预测:“我想吃饭和水果” 
那岂不是全天下都无哑巴了。 
佬们觉得能实现吗。
 
 
Back to Top