做问卷调查,有很多个板块(比如下面是两组问题,需要询问母语者是否认为不符合语法),但是每一个板块的内容都很相似,所以想把这些问题的顺序打散一下,减少答题者机械化答题时会出现错误的情况。 …
Author: ynshen
删掉网页的 meta 信息
这几天要动用私人语料库写一份关于斯瓦希里语(以下简称斯语)助动词的论文,发现几个月前抓的《好公民周报(Raia Mwema)》的网页信息并没有把各种 meta 标签删掉。 …
识别一份文本的所属语言
导师 S 介绍了一个项目让我知道,是关于使用 Python 抓取一些德语的 Twitter 信息,项目维护者是 Tatjana Scheffler。导师 S 建议我用来抓取一些斯瓦希里语(以下简称斯语)的信息。 …