《数学之美》读书笔记

  读了吴军博士的《数学之美》,收获很大,让我从一些更深刻的层次去了解事物,比如从原理上了解了为什么输入汉字,输入词组的方式比输入单个字的方式要快的多,比如人工神经网络是什么,比如如何快速地比较两个集合是否相等。

  在这里对收获进行一下整理:

  1,集合相同的判定:“完美的计算是计算着两个集合的指纹,然后直接进行比较” 就是把集合内所有的元素通过采集信息指纹的方式(例如md5)算出来再相加,利用加法的交换律(a+b = b+a)判断集合是否相同。

  2.seo(搜索引擎优化)其实是一种排名作弊

  3.1)一个正确的模型应当在形式上是简单的
  2)一个正确的模型一开始可能还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。
  3)大量准确的数据对研发很重要
  4)正确的模型也可能受噪音干扰,这是不应该用一种凑合的方式去弥补,而是要找到噪音的根源,这也许通往重大的发现。

  4.最大熵模型:对一个随机事件的改路分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任何主观预测。

  5."最后,王永民的五笔输入法暂时胜出,但并不是他的编码方式更合理,而是他比其他发明者更会做市场而已"
  (拼音输入法的好处)“第一,他不需要专门学习,第二,输入自然,不会中断思维,也就是找到每个键的时间非常短。第三,因为编码长。有信息冗余量,容错性好”   输入一个汉字平均需要输入10/4.7 ≈2.1次键 如果把汉字组成词,再以词统计信息熵,那么每个字的平均信息熵将会减少,这时,输入一个汉字只需要敲6/4.7≈1.3次按键。

  6.CMDA(3G)码分多址 FDMA频分多址 TDMA时分多址

  7. 1)人工神经网络:他是一种特殊的有向图,他有这两个特点:所有节点都是可以分层的,每一层节点可以通过有向弧指向上一层节点,同一层节点之间没有弧进行连接,而且每一个节点不能越过一层连接到上上层的节点上。
  2).每一条弧上有一个值(称为权重或者权值)根据这些值,可以用一个非常简单的公式算出他们所指节点的值。
  3).最下面一层节点被称为输入层,最上一层节点被称为输出层,中间被称为不可见层。

  8.大数据不仅在IT行业有用,在别的领域也能发挥巨大作用,比如医疗。

  9,布隆过滤器(判断一个元素是否在一个集合中),
  贝叶斯网络(计算不同状态的因果关系),
  维特比算法(针对计算篱笆网络的特定算法,在计算机通讯中有大量应用)
  余弦定理(可以给通过相关性给事物分类)

  10.信息熵:要传递的信息不确定性越大,他的信息熵就越大。

  11.“小学生和中学生其实没有必要花那么多时间读书,而他们的社会经验生活能力以及在那时树立起的志向将帮助他们的一生”
  “我一直认为,一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物”

kisence

潮落江平未有风。