知识的粒度

Q: 到底应该把一本书拆成一万个知识片段,还是1K个知识片段,还是100个呢? A: 不同的片段大小有不同层次的信息。他们都是有价值,应该保留的 Q: 那不同的知识,他们的权重是否一样呢?书名就一句话,和一段常常的论述,他们的价值是否应该相等? A: 权重取值为log(length(text)),长和短的区别其实没那么大。但是还是有差别 Q: 那知识观点如何整理以供使用? A: 聚类,提取主要观点 Q: 聚类后的观念无法反应作者的知识结构,是否会让用户很难接收? A:是的,观点不再以章节为单位进行区分了。这的确会让用户在消化上不习惯。因为找不到对应。但是别忘了,书本是作者的剪辑,就像是用原料做出的菜。但是读者的心智看到的应该是原本的菜和尽可能看到所有的菜的可能。不应该试图还原出作者试图传递的味道,而应该快速体会作者的确可以试图做出这个味道的菜。作者终也有涯。作品若是完美,只是让我们处于钻石的闪光面。 Q:那如果一定要向用户的顺序期望妥协怎么办? A:那就只能精排序了