完成算法分析；准备哈希表

PegasusWang · PegasusWang · commit c81ebc67c699 · 2018-04-20T21:51:16.000+08:00
diff --git a/README.md b/README.md
@@ -139,7 +139,6 @@ Python 抽象程度比较高， 我们能用更少的代码来实现功能，同
 对于找工作的同学提升面试成功率。
 
 
-
 ## 工具
 
 推荐使用以下工具进行开发，如果使用编辑器最好装对 应 Python 插件：
@@ -173,5 +172,5 @@ pip install https://github.com/mitya57/python-markdown-math/archive/master.zip
 编写并查看：
 ```sh
 mkdocs serve     # 修改自动更新，http://localhost:8000 访问
+# 数学公式参考 https://www.zybuluo.com/codeep/note/163962
 ```
-
diff --git a/docs/6_算法分析/big_o.md b/docs/6_算法分析/big_o.md
@@ -10,9 +10,13 @@ https://book.douban.com/subject/10607365/) 中给的一个例子:
 
 考虑计算一个 n * n 矩阵所有元素的和（如果你不知道矩阵，就理解为一个二维数组）：
 
-[0, 1, 2]
-[3, 4, 5]
-[6, 7, 8]
+$$
+        \begin{bmatrix}
+        0 & 1 & 2 \\
+        3 & 4 & 5 \\
+        6 & 7 & 8 \\
+        \end{bmatrix}
+$$
 
 这里列举两种方式:
 
@@ -34,24 +38,51 @@ for i in range(n):
     total_sum = total_sum + row_sum[i]    # 注意这里和上边的不同
 ```
 
-v1 版本的关键操作在 j 循环里，两步加法操作，由于嵌套在第一个循环里，操作步骤是 $(2n) * n = 2n^2$。
-v2 版本的 total_sum 只有 n 次操作，它的操作次数是 n + n*n = n^2 + n
+v1 版本的关键操作在 j 循环里，两步加法操作，由于嵌套在第一个循环里，操作步骤是 $  (2n) * n = 2n^2  $。
+
+v2 版本的 total_sum 只有 n 次操作，它的操作次数是 $ n + n*n = n^2 + n $。
 
 
 这里你可能还感觉不到它们有多大差别，因为计算机执行的太快了，但是当 n 增长特别快的时候，总的操作次数差距就很明显了：
 
-n      | 2n^2           | n^2 +n         |
+n      | $ 2n^2 $       | $ n^2 +n $     |
 -------|----------------|----------------|
 10     | 200            | 110            |
 100    | 20,000         | 10,100         |
 1000   | 2,000,000      | 1,001,000      |
 10000  | 200,000,000    | 100,010,000    |
 100000 | 20,000,000,000 | 10,000,100,000 |
 
+通常我们不太关注每个算法具体执行了多少次，而更关心随着输入规模 n 的增加，算法运行时间将以什么速度增加。为此计算机科学家定义了一个符号，
+用来表示在最糟糕的情况下算法的运行时间，大 O 符号，在数学上称之为渐进上界（《算法导论》）。
+
+# 如何计算时间复杂度
+上边我们列举了两个版本的计算矩阵和的代码，你看到了两个公式:
+
+- v1: $ 2n*n = 2n^2 $
+- v2: $ n + n*n = n + n^2 $
+
+当 n 非常大的时候，$ n^2 $ 的数值这里将占主导，我们可以忽略 n 的影响
+
+- v1: $ 2n*n = 2n^2 $
+- v2: $ n + n*n = n + n^2 \leq 2n^2 $
 
-$$ x^{y^z}=(1+{\rm e}^x)^{-2xy^w} $$
+这里我们可以认为两个算法的时间复杂度均为 $ O(n^2) $
 
-# 时间复杂度
+# 常用时间复杂度
+这里我们列举一些常用的时间复杂度，按照增长速度排序，日常我们的业务代码中最常用的是指数之前的复杂度，指数和阶乘的增长速度非常快，
+当输入比较大的时候用在业务代码里是不可接受的。
+
+O         | 名称         | 举例               |
+----------|--------------|--------------------|
+1         | 常量时间     | 一次赋值           |
+$\log n$  | 对数时间     | 折半查找           |
+$n$       | 线性时间     | 线性查找           |
+n$\log n$ | 对数线性时间 | 快速排序           |
+$n^2$     | 平方         | 两重循环           |
+$n^3$     | 立方         | 三重循环           |
+$2^n$     | 指数         | 递归求斐波那契数列 |
+$n!$      | 阶乘         | 旅行商问题         |
 
 
 # 空间复杂度
@@ -62,11 +93,14 @@ $$ x^{y^z}=(1+{\rm e}^x)^{-2xy^w} $$
 
 
 # 常见复杂度增长趋势图
-为了让你有个直观的感觉，我们来看看一些经典的时间复杂度和对应的增长趋势图。
+为了让你有个直观的感觉，我们来看看一些经典的时间复杂度和对应的增长趋势图，不同函数在输入规模增长的时候很快就会有巨大的增长差异
+
+![函数增长趋势图](./function_growth.png)
 
 
 # 时间换空间，空间换时间
 有一些时候时间和空间两者不可兼得，我们会牺牲其中之一来换取另一个。
+
 空间换时间：比如典型的就是 python 中的集合（后面会讲到它的实现原理），虽然它比较浪费空间，但是却能用 O(1)
 的时间复杂度来判重。
 
@@ -80,9 +114,9 @@ $$ x^{y^z}=(1+{\rm e}^x)^{-2xy^w} $$
   的时间复杂度吗？你会用数学公式证明吗？
 - 你能指出时间和空间权衡的例子吗？往往很多高效的数据结构能同时兼顾时间和空间复杂度，但是有时候我们却得做出一定的权衡
 
+
 # 参考资料
-如果你对数学感兴趣，建议你阅读《算法导论》『函数的增长』这一节。
-和《Data Structures and Algorithms in Python》第4章。
+如果你对数学感兴趣，建议你阅读《算法导论》『函数的增长』这一节 和《Data Structures and Algorithms in Python》第4章。
 
 
 (本章我用了 [MathJax](https://www.zybuluo.com/codeep/note/163962) 来书写一些简单的数学公式，使用 "$"包含起来的就是数学公式)
diff --git a/docs/6_算法分析/function_growth.png b/docs/6_算法分析/function_growth.png
diff --git a/docs/7_哈希表/hashtable.md b/docs/7_哈希表/hashtable.md
@@ -0,0 +1,15 @@
+# 哈希表
+不知道你有没有好奇过为什么 Python 里的 dict 和 set 查找速度这么快呢，用了什么黑魔法吗？
+经常听别人说哈希表，究竟什么是哈希表呢？这一章我们来介绍哈希表，后续章节我们会看到 Python 中的字典和集合是如何实现的。
+
+# 如何在 O(1) 时间内查找
+前面我们已经讲到了数组和链表，数组能通过下标 O(1) 访问，但是删除一个中间元素却要移动其他元素，时间 O(n)。
+循环双端链表倒是可以在知道一个节点的情况下迅速删除它，但是吧查找又成了 O(n)。
+难道就没有一种方法可以快速定位和删除元素吗？似乎想要快速找到一个元素除了知道下标之外别无他法，于是乎聪明的计算机科学家又想到了一种方法。
+能不能给每个元素一种『逻辑下标』，然后直接找到它呢，哈希表就是这种实现。它通过一个函数来计算一个元素应该放在数组哪个位置，当然对于一个
+特定的元素，哈希函数每次计算的下标必须要一样才可以：
+
+```
+hash(element) = index
+```
+
diff --git a/docs/index.md b/docs/index.md
@@ -7,7 +7,7 @@
 
 ## 痛点
 - 讲 Python 数据结构和算法的资料很少，中文资料更少
-- 很多自学 Python 的工程师对基础不够重视，面试也发现很多数据结构和算法不过关，太多人挂在了基础的数据结构和算法上
+- 转行的工程师越来越多，竞争压力越来越大，很多自学 Python 的工程师对基础不够重视，面试也发现很多数据结构和算法不过关，很多人挂在了基础的数据结构和算法上。
 - 缺少工程应用场景下的讲解，很多讲算法的资料太『教科书化』。本书实现的代码工程上可用
 
 ## 作者简介
@@ -173,5 +173,5 @@ pip install https://github.com/mitya57/python-markdown-math/archive/master.zip
 编写并查看：
 ```sh
 mkdocs serve     # 修改自动更新，http://localhost:8000 访问
+# 数学公式参考 https://www.zybuluo.com/codeep/note/163962
 ```
-
diff --git a/mkdocs.yml b/mkdocs.yml
@@ -4,13 +4,16 @@ extra_javascript:
     - https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.0/MathJax.js?config=TeX-AMS-MML_HTMLorMML
 
 markdown_extensions:
-    - mdx_math
+  - mdx_math:
+       enable_dollar_delimiter: True #for use of inline $..$
+
 pages:
   - 课程简介: 'index.md'
-  - 课程简介之本方法学算法: '0_课程简介之笨方法学算法/why_and_how_to_learn.md'
+  - 课程简介之笨方法学算法: '0_课程简介之笨方法学算法/why_and_how_to_learn.md'
   - 抽象数据类型和面向对象编程: '1_抽象数据类型和面向对象编程/ADT_OOP.md'
   - 数组和列表: '2_数组和列表/array_and_list.md'
   - 链表: '3_链表/linked_list.md'
   - 队列: '4_队列/queue.md'
   - 栈: '5_栈/stack.md'
   - 算法分析: '6_算法分析/big_o.md'
+  - 哈希表: '7_哈希表/hashtable.md'