登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
专栏 A

读者评论: Token翻译为词元的得失是什么?

刘远举:词元这个字面翻译更多地保留了形式上文字的纯洁性,但并不能争取到所谓的话语权,而在语义上的丢失,则会产生深远的技术影响。
昨天 11:12 来自美国
基於起源來自大語言模型的核心技術的翻譯,符合本質,又可追溯其脈絡,是最合適的選擇。如果還要因為後續延伸出圖像、音樂、影片等不同應用的考慮,而模糊了其原生性,並不妥。
回复 支持(0) 反对(0)
昨天 11:10 来自北京市
要不说这几个常发文的同学没什么可读性呢。举了个栗子说“花”的延伸和拓展,确又把“词”焊死在固定的意涵上,还煞有介事的搬出维特根斯坦.......这就是常说的:一瓶子不满半瓶子晃荡吧。

模元或许最科学,不过,模元虽是科学,词元更是生活本身吧
回复 支持(0) 反对(0)
用户名:
FT中文网欢迎读者发表评论,部分评论会被选进《读者有话说》栏目。我们保留编辑与出版的权利。
用户名
密码

远观近思

刘远举,重庆人,先学理工科再学经济学,从事过咨询行业,现为自由撰稿人。关注时政、财经、科技,旨在探寻现象背后的事实与公正。文风理性、客观,且用人性的温度替换虚伪的中立。微博ID@刘远举。

相关文章