毛球球 (@maoqiuqiu) 在 我觉得transformer架构完全可以为聋哑人做一些事情。 中发帖
我突然在想transformer底层是预测,那是不是聋哑人能够通过默念,识别唇语,结合语境,再通过tts将声音输出出去。
即便唇语的识别可能不太精准,但transformer不就是为此服务的吗。
识别:“我想。。饭。。果”
通过transformer识别预测:“我想吃饭和水果”
那岂不是全天下都无哑巴了。
佬们觉得能实现吗。