设为首页收藏本站

知讯网-财务分析、股票分析-专注管理、经营、创业、科技等资讯

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
查看: 921|回复: 0
打印 上一主题 下一主题

计算机构建原始语,历史语言学家遭遇“危机”

[复制链接]
跳转到指定楼层
楼主
发表于 2013-2-18 20:32:57 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
大豆包难吃 2013-02-11 20:05
研究者用一种新的计算机系统构建出一组远古的方言,其相似度和艰苦卓绝的人工编纂相比高达80%。在拿下那么多个学科之后,统计学和计算机又联手攻入了语言学。实力强劲的新人到来,历史语言学家莫非危机了?


来自英属哥伦比亚大学和美国加州大学伯克利分校的研究人员,使用一个新的计算机系统在短时间内拟构了一组原始母语(Protolanguages)。与语言学家费时费力人工拟构的结果相比,系统的准确率达 85%。研究结果今天在《美国国家科学院院刊》(PNAS)上发表。

论文的主要作者、英属哥伦比亚大学的统计学助理教授亚历山大布沙尔-柯特(Alexandre Bouchard-C琀é)说: “我们希望我们的工具将彻底改变历史语言学,就像统计分析和计算机的力量彻底改变了演化生物学的研究那样。”

他说:“系统并不会取代在行的语言学家细致入微的工作;但颇有价值的一点是,它可以增加语言学家使用的现代语的数量,也就是他们拟构的基础。”

历史比较语言学认为,现代具有亲属关系的语言在历史上源于一种语言,这种语言就是它们的母语。原始母语的拟构(reconstruction),就是将现代的亲属语中拥有共同意义的词分组,分析这些词的共同特点,然后根据音调变化等规律,推导出共同的母语。

布沙尔-柯特和美国加州大学伯克利分校的同事一起研发了这个新的工具,它能分析声音在基本的语言单元这一层面的变化,运算规模也比以前的电算化工具要大。

拟建使用的数据库包含1.42万多个词形,来自637种南岛语系(Austronesian)语言。南岛语系主要分布于东南亚和太平洋地区,是现今世界上唯一主要分布在岛屿上的语系,包括大约1300种语言。台湾是南岛语系的源头,目前是人口分布上的地理最北端。

背景知识:大多数原始母语都没有夠下书面记录;但在一些情况下,拟构可以通过古籍或文史得到部分的验证。其中一个例子便是保有良好记录的拉丁语,它是罗曼语族(拉丁语族)的原始母语,现代法语、意大利语、葡萄牙语、罗马尼亚语、加泰罗尼亚语和西班牙语都是从拉丁语演化而来。

信息来源:EurekAlert!
文章图片:io9.com

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|知讯网    

GMT+8, 2025-1-16 00:47 , Processed in 0.058450 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表