<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Cinker&#039;s blog &#187; Language</title>
	<atom:link href="http://www.cinker.com/tag/language/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.cinker.com</link>
	<description>we are building something for eternity.</description>
	<lastBuildDate>Sat, 07 Jan 2012 23:42:03 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>汉字的数量：词涯七千</title>
		<link>http://www.cinker.com/2008/10/21/chinese-words/</link>
		<comments>http://www.cinker.com/2008/10/21/chinese-words/#comments</comments>
		<pubDate>Tue, 21 Oct 2008 01:52:07 +0000</pubDate>
		<dc:creator>Steven</dc:creator>
				<category><![CDATA[Reflection]]></category>
		<category><![CDATA[Language]]></category>
		<category><![CDATA[Ruanyifeng]]></category>

		<guid isPermaLink="false">http://www.cinker.com/?p=142</guid>
		<description><![CDATA[汉字的源头，如果追溯到西安半坡遗址出土的陶器上的符号，大概有6000多年历史了。已发现的符号有100多个。那么就算6000年多年前，汉字数量是100多。 接下来是3000多年前的甲骨文，那时汉字... ]]></description>
			<content:encoded><![CDATA[<p>汉字的源头，如果追溯到西安半坡遗址出土的陶器上的符号，大概有6000多年历史了。已发现的符号有100多个。那么就算6000年多年前，汉字数量是100多。<br />
接下来是3000多年前的甲骨文，那时汉字数量已经超过3000了。</p>
<p>以下是历代主要字书上的汉字数。</p>
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<th>字书名</th>
<th>编者</th>
<th>字数</th>
<th>年代</th>
</tr>
<tr>
<td>《仓颉篇》</td>
<td>李斯</td>
<td>3300</td>
<td>秦代（约公元前220年）</td>
</tr>
<tr>
<td><span style="color: #000000;">《训纂篇》</span></td>
<td><span style="color: #000000;">扬雄</span></td>
<td>5340</td>
<td>汉代，公元1-5年</td>
</tr>
<tr>
<td>《续训篇》</td>
<td>班固</td>
<td>6180</td>
<td>汉代，公元60-70年</td>
</tr>
<tr>
<td>《说文解字》</td>
<td>许慎</td>
<td>10516（重文1163字）</td>
<td>汉代，公元100年</td>
</tr>
<tr>
<td>《广雅》</td>
<td>张揖</td>
<td>16150</td>
<td>汉代</td>
</tr>
<tr>
<td>《声类》</td>
<td>李登</td>
<td>11520</td>
<td>魏，230年</td>
</tr>
<tr>
<td>《字林》</td>
<td>吕忱</td>
<td>12824</td>
<td>晋，400年</td>
</tr>
<tr>
<td>《字统》</td>
<td>杨承庆</td>
<td>13734</td>
<td>北魏，500年</td>
</tr>
<tr>
<td>《玉篇》</td>
<td>顾野王</td>
<td>16917</td>
<td>南梁，534年</td>
</tr>
<tr>
<td>《切韵》</td>
<td>陆法言</td>
<td>12158</td>
<td>隋代，601年</td>
</tr>
<tr>
<td>《韵海境源》</td>
<td>颜真卿</td>
<td>26911</td>
<td>唐代，753年</td>
</tr>
<tr>
<td>《龙龛手鉴》</td>
<td>释行均</td>
<td>26430</td>
<td>辽代，997年</td>
</tr>
<tr>
<td>《广韵》</td>
<td>陈彭年</td>
<td>26194</td>
<td>宋代，1008年</td>
</tr>
<tr>
<td>《字汇》</td>
<td>梅膺祚</td>
<td>33179</td>
<td>明代，1615年</td>
</tr>
<tr>
<td>《正字通》</td>
<td>张自烈</td>
<td>33440</td>
<td>明代，1675年</td>
</tr>
<tr>
<td>《康熙字典》</td>
<td>陈廷敬</td>
<td>47043</td>
<td>清代，1716年</td>
</tr>
<tr>
<td>《大汉和辞典》</td>
<td>诸桥辙次</td>
<td>49964</td>
<td>1959年</td>
</tr>
<tr>
<td style="height: 25px;">《中文大辞典》</td>
<td style="height: 25px;">张其昀</td>
<td style="height: 25px;">49888</td>
<td style="height: 25px;">1971年</td>
</tr>
<tr>
<td>《新部首大字典》</td>
<td>王竹溪</td>
<td>51100</td>
<td>1988年</td>
</tr>
<tr>
<td>《汉语大字典》</td>
<td>徐中舒</td>
<td>53768</td>
<td>1990年</td>
</tr>
<tr>
<td>《中华字海》</td>
<td>冷玉龙</td>
<td>86000</td>
<td>1994年</td>
</tr>
</tbody>
</table>
<p>汉字虽然有几万个，但是平时用到的不到十分之一。</p>
<p>下面是《二十四史》的总字数和单字数。</p>
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<th>书名</th>
<th>总字数</th>
<th>单字数</th>
<th>成书年代</th>
</tr>
<tr>
<td>《史记》</td>
<td>533505</td>
<td>5122</td>
<td>公元前93年</td>
</tr>
<tr>
<td>《汉书》</td>
<td>742298</td>
<td>5833</td>
<td>公元前83年</td>
</tr>
<tr>
<td>《三国志》</td>
<td>377803</td>
<td>4388</td>
<td>289年</td>
</tr>
<tr>
<td>《后汉书》</td>
<td>894020</td>
<td>6161</td>
<td>488年</td>
</tr>
<tr>
<td>《宋书》</td>
<td>811893</td>
<td>5842</td>
<td>488年</td>
</tr>
<tr>
<td>《南齐书》</td>
<td>299257</td>
<td>4962</td>
<td>514年</td>
</tr>
<tr>
<td>《魏书》</td>
<td>998329</td>
<td>5417</td>
<td>554年</td>
</tr>
<tr>
<td>《梁书》</td>
<td>294438</td>
<td>4937</td>
<td>636年</td>
</tr>
<tr>
<td>《陈书》</td>
<td>163382</td>
<td>4033</td>
<td>636年</td>
</tr>
<tr>
<td>《北齐书》</td>
<td>212506</td>
<td>4032</td>
<td>636年</td>
</tr>
<tr>
<td>《周书》</td>
<td>262659</td>
<td>4161</td>
<td>636年</td>
</tr>
<tr>
<td>《晋书》</td>
<td>1158126</td>
<td>5997</td>
<td>648年</td>
</tr>
<tr>
<td>《隋书》</td>
<td>701698</td>
<td>5592</td>
<td>656年</td>
</tr>
<tr>
<td>《南史》</td>
<td>677624</td>
<td>5376</td>
<td>659年</td>
</tr>
<tr>
<td>《北史》</td>
<td>1106543</td>
<td>6346</td>
<td>659年</td>
</tr>
<tr>
<td>《旧唐书》</td>
<td>2002600</td>
<td>6346</td>
<td>945年</td>
</tr>
<tr>
<td>《旧五代史》</td>
<td>790879</td>
<td>5109</td>
<td>979年</td>
</tr>
<tr>
<td>《新唐书》</td>
<td>1694794</td>
<td>6346</td>
<td>1060年</td>
</tr>
<tr>
<td>《新五代史》</td>
<td>291476</td>
<td>3909</td>
<td>1072年</td>
</tr>
<tr>
<td style="height: 26px;">《辽史》</td>
<td style="height: 26px;">296254</td>
<td style="height: 26px;">4071</td>
<td style="height: 26px;">1344年</td>
</tr>
<tr>
<td>《金史》</td>
<td>931070</td>
<td>5264</td>
<td>1344年</td>
</tr>
<tr>
<td>《宋史》</td>
<td>3980123</td>
<td>7389</td>
<td>1345年</td>
</tr>
<tr>
<td>《元史》</td>
<td>1611849</td>
<td>5854</td>
<td>1370年</td>
</tr>
<tr>
<td>《明史》</td>
<td>2802544</td>
<td>7124</td>
<td>1739年</td>
</tr>
<tr>
<td>《清史》</td>
<td>4514567</td>
<td>8080</td>
<td>1927年</td>
</tr>
</tbody>
</table>
<p>即使写像《二十四史》这样最讲究文字的书，7000个汉字也够了。99.9％以上的中国人，识字量不到7000。日常阅读的话，3500个字就可以。</p>
<p>对比英语，要达到主流社会的阅读水平，非得有20000以上的词汇量不可。可见，可能还是汉字的记忆负担小。</p>
<img src="http://www.cinker.com/?ak_action=api_record_view&id=142&type=feed" alt="" /><h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li>12/12/2008 -- <a href="http://www.cinker.com/2008/12/12/badeconomy/" title="Paul Graham：为什么在经济危机中创业？">Paul Graham：为什么在经济危机中创业？</a> (0)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/from-wayaobao/" title="从瓦窑堡的读音说起">从瓦窑堡的读音说起</a> (4)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/the-history-of-latin-alphbe/" title="拉丁字母的历史">拉丁字母的历史</a> (0)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/how-to-be-thoughtful/" title="如何变得有思想?">如何变得有思想?</a> (0)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/the-common-pronounced-words/" title="中国容易误读的地名">中国容易误读的地名</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.cinker.com/2008/10/21/chinese-words/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>从瓦窑堡的读音说起</title>
		<link>http://www.cinker.com/2008/10/21/from-wayaobao/</link>
		<comments>http://www.cinker.com/2008/10/21/from-wayaobao/#comments</comments>
		<pubDate>Tue, 21 Oct 2008 01:46:39 +0000</pubDate>
		<dc:creator>Steven</dc:creator>
				<category><![CDATA[Reflection]]></category>
		<category><![CDATA[Language]]></category>

		<guid isPermaLink="false">http://www.cinker.com/?p=130</guid>
		<description><![CDATA[一说“瓦窑堡”，想必大家都不陌生，革命圣地。让各位来念这个地名，想必很多朋友会笑话我，这个都不会？不就是wǎ yáo bǎo么，这个难不倒我。那好，那我再问“十里堡”如何念呢，各位... ]]></description>
			<content:encoded><![CDATA[<p>一说“瓦窑堡”，想必大家都不陌生，革命圣地。让各位来念这个地名，想必很多朋友会笑话我，这个都不会？不就是wǎ yáo bǎo么，这个难不倒我。那好，那我再问“十里堡”如何念呢，各位可能会认为这个更简单了，不就是shí lí bǎo么。那我要告诉你，两个音都错了，而且两个音还不一样。第一个“瓦窑堡”中的“堡”当念“bǔ”，而“十里堡”中的却该念“pù”。</p>
<p>“堡”有三个音，其中一个bǎo是我们耳熟能详的，而bǔ的含义是“有城墙的村镇”，“pù”在古代同“铺”，驿站的意思。<br />
详细情况，各位可以参考<a href="http://www.zdic.net/zd/zi/zdice5zdica0zdica1.htm">http://www.zdic.net/</a><br />
这个音正了，那咱们再看看这句话，“天上出虹了”中的“虹”又该如何念呢，很让人沮丧，竟然该念“jiàng”。<br />
<del datetime="2009-10-14T01:57:56+00:00">如果说上面那个不常见，那就看看这个，“便秘”中的“秘”又当如何念呢？是读“bì”，原来中国电视台误导了我们岂止十多年？中央电视台也常犯错误！</del><font color=red>（网友指正后，经查《普通话异读词审音表》，发现“秘 （除“～鲁”读bì外，都读mì）”。我谨对原文出现的错误表示道歉。）</font><br />
可是，这些错误的读音都已经约定成俗了，可以说，老百姓们也没有那份心情去纠正这些读音，这样一代又一代的传播下去，不知道会变成什么样？很是担心。我注意到，这些音都是集中了，将一些不常用的音归到常用音下，可意思呢，却要将不常用音的意思也要搬过去，这要造成的直接后果是使意思重叠，难以区分，以后会愈来愈难解释。</p>
<img src="http://www.cinker.com/?ak_action=api_record_view&id=130&type=feed" alt="" /><h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/chinese-words/" title="汉字的数量：词涯七千">汉字的数量：词涯七千</a> (0)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/the-common-pronounced-words/" title="中国容易误读的地名">中国容易误读的地名</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.cinker.com/2008/10/21/from-wayaobao/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>中国容易误读的地名</title>
		<link>http://www.cinker.com/2008/10/21/the-common-pronounced-words/</link>
		<comments>http://www.cinker.com/2008/10/21/the-common-pronounced-words/#comments</comments>
		<pubDate>Tue, 21 Oct 2008 00:39:54 +0000</pubDate>
		<dc:creator>Steven</dc:creator>
				<category><![CDATA[Reflection]]></category>
		<category><![CDATA[Language]]></category>

		<guid isPermaLink="false">http://www.cinker.com/?p=64</guid>
		<description><![CDATA[据说在80年前，冯玉祥手下的一个参谋在书写作战命令的时候，把部队集结的地点沁阳随手写成泌阳。沁阳在河南北部的焦作地区，而泌阳在河南南部的驻马店地区。只多了一笔，部队瞎跑了几... ]]></description>
			<content:encoded><![CDATA[<p>据说在80年前，冯玉祥手下的一个参谋在书写作战命令的时候，把部队集结的地点沁阳随手写成泌阳。沁阳在河南北部的焦作地区，而泌阳在河南南部的驻马店地区。只多了一笔，部队瞎跑了几百公里，整个战役也就完全失败了。<br />
我们也有过把岷江(mín民)洪水读成闽江洪水,岷江在西南,而闽江在东南，比沁阳和泌阳之间的距离更远。</p>
<p>在电视节目中，误读地名是一件很郁闷也很难堪的事情，而且很容易成为一种笑柄。读对地名，是对人家起码的尊重。</p>
<p>浙江的丽水（lí离）被误读成丽（lì立）水，台州（tāi）被误读成台(tái抬)州；<br />
安徽的亳（bó驳）州，几乎经常被读作多了一横的毫（háo）州；<br />
湖北的监利（jiàn见）被误读成监(jiān尖)利；<br />
河南的浚县（xùn训）被误读成浚（jùn俊）县；<br />
湖南的耒阳(lěi垒) 被误读成来阳，而真正的莱阳在山东；<br />
郴州(chēn抻)被误读成彬（bīn宾）州；<br />
新疆的巴音郭楞（léng）被误读成愣(lèng)，这两个字长得很像，一不留神就读错；<br />
内蒙古的巴彦淖尔(nào闹)被误读成卓(zhuó)，所以有一次和巴彦淖尔的同志一起联欢，他们的第一件事就是热情地感谢我读对了他们家乡的名字。可见平常误读率很高。</p>
<p>有些误读是因为地名中含有多音字，需要坚持的是“名从主人”的原则，例如：<br />
河北的蔚县，正确读音是yù（玉）；<br />
安徽的歙县，正确读音是shè（社）；六安，正确读音是lù（路）；<br />
山西的繁峙县，正确读音是shì（是）；长子县，正确读音是zhǎng（掌）；<br />
山东莘（shēn深）县，学生们一般读不错，因为有莘莘学子之说；但我到上海又读错了上海莘庄(xīn新)。江西铅山（yán盐）,误读率一定很高,因为谁想到普通的”铅”还是多音字而且是地名专用的字音。反正一不留神我可能就会读错。<br />
象福建厦门、广东番禺、安徽蚌埠，虽然也含有异音字，但因为知名度高，被误读的几率相对比较低。读错山东东阿的比较少，感谢关于阿胶的广告；读错涪陵的比较少，感谢来自涪陵的榨菜；读错山西洪洞的也比较少，因为那句“苏三离了洪洞县”起到了积极的推广作用。<br />
辽宁阜新，在辽宁一般被读成fú（扶），在北京一般被读成fǔ（抚），而正确的读音却是fù（富）。</p>
<p>另外很多情况下是因为有些字根本就没见过，望字猜音，跟着感觉走。包括我们这些以说话念字为职业、普通话水平一级甲等的人在内，如果能第一眼就读对95%的中国地名，那就相当超水平发挥的了。<br />
山西的隰县（Ｘí），山东的莒县（jǔ），茌（chí）平<br />
河北的井陉（xíng），蠡县（lǐ）；<br />
四川的郫县（pí），珙县（gǒng），犍为（qián前）；<br />
安徽的黟县（yī），枞阳（zōng）；<br />
湖北的郧县（yún）,江西的婺源（wù）；浙江的鄞县(yín)；<br />
江苏的盱眙（xūyí），邗江（hán），邳州（pī）；<br />
河南的柘城（zhè），武陟（zhì）；</p>
<p>看着其中的某些字，仿佛回到了春秋战国时期。中国的很多文化和城市的历史密码，往往都固化在地名里了。<br />
当然，语言是流动的，是液态的，今天的错误有些或许就成为明天的正音了，字典只是一个特定时代的语音规范。语音的确定是一个大浪淘沙的过程，而这一切都是人逐渐造就的。</p>
<img src="http://www.cinker.com/?ak_action=api_record_view&id=64&type=feed" alt="" /><h2  class="related_post_title">Related Posts</h2><ul class="related_post"><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/chinese-words/" title="汉字的数量：词涯七千">汉字的数量：词涯七千</a> (0)</li><li>21/10/2008 -- <a href="http://www.cinker.com/2008/10/21/from-wayaobao/" title="从瓦窑堡的读音说起">从瓦窑堡的读音说起</a> (4)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.cinker.com/2008/10/21/the-common-pronounced-words/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

