出版社: 机械工业出版社
原作名: Mining the Social Web : Analyzing Data from Facebook, Twitter, LinkedIn, and Other Social Media Sites
译者: 师蓉
出版年: 2012-2
页数: 301
定价: 59.00元
装帧: 平装
丛书: O'Reilly动物系列(中译本)
ISBN: 9787111369608
内容简介 · · · · · ·
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系...
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系
•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术
•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
社交网站的数据挖掘与分析的创作者
· · · · · ·
-
-
师蓉 译者
作者简介 · · · · · ·
马修·罗塞尔(Matthew A.Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Dofinitive Guide》(O'Reilly出版社)的作者。在LinkedIn上联系他或在Twitter上关注@ptwobrussell,可随时关注他的最新动态。
目录 · · · · · ·
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
· · · · · · (更多)
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
小结163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类164
聚类的动机165
按职位将联系人聚类167
获取补充个人信息183
从地理上聚类网络188
小结192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 处理数据198
文本挖掘的基本原则201
查找相似文档208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎……225
小结226
第8章博客及其他:自然语言处理(等)228
NLP :帕累托式介绍228
使用NLTK 的典型NLP 管线231
使用NLTK 检测博客中的句子234
对文件的总结237
以实体为中心的分析:对数据的深层了解245
小结256
第9章Facebook :一体化的奇迹257
利用社交网络数据258
对Facebook 数据的可视化274
小结294
第10 章语义网:简短的讨论296
发展中的变革296
人不可能只靠事实生活297
期望301
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
-
While there are usually a few general-purpose tools that work fairly well for most jobs, there aren’t any tools that work well for every job. (查看原文) —— 引自第108页 -
You have a price to pay either way; generally speaking, the price is either paid up front, when you store the data in special indexes (as you learned was the case with CouchDB in the previous chapter), or at query time, when you look it up and don’t have the benefit of those indexes. (查看原文) —— 引自第108页
> 全部原文摘录
丛书信息
· · · · · ·
喜欢读"社交网站的数据挖掘与分析"的人也喜欢的电子书 · · · · · ·
喜欢读"社交网站的数据挖掘与分析"的人也喜欢 · · · · · ·
社交网站的数据挖掘与分析的书评 · · · · · · ( 全部 12 条 )
各种python库的一日游 所谓的社交网络数据挖掘只停留在浅层次上
书本身还可以,翻译的操蛋。
> 更多书评 12篇
论坛 · · · · · ·
| 第二版 | 来自Dhyan Zari | 2013-10-11 07:29:40 | |
| 好书啊 | 来自枣糕王 | 15 回应 | 2012-03-21 09:20:49 |
这本书的其他版本 · · · · · · ( 全部7 )
-
O'Reilly Media (2011)7.5分 73人读过
-
机械工业出版社 (2015)6.4分 30人读过
-
东南大学出版社 (2011)暂无评分 7人读过
-
O'Reilly Media (2013)暂无评分 3人读过
在哪儿借这本书 · · · · · ·
以下书单推荐 · · · · · · ( 全部 )
- IT好书100本 (左神神)
- 社会网络分析技术:探索复杂性与自组织性 (欧阳)
- 从文科生到数据分析师(书籍部分) (福娃迎迎)
- 数据挖掘、统计、机器学习 (大米粒)
- 网络研究 (一切归零)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
订阅关于社交网站的数据挖掘与分析的评论:
feed: rss 2.0










1 有用 火姬serafina 2014-12-17 00:54:29
、
0 有用 Acoustic Life 2013-01-31 23:39:59
主要是一些API,一般
0 有用 Fity 2013-12-02 12:58:00
翻译大问题没有,小问题不断。数学公式什么的括号匹配不上就实在有点儿无法理解了。整本书重点其实是在讲工具而不是数据挖掘和分析的感觉。
0 有用 陈钢 2012-09-11 22:10:01
基本入门书籍
0 有用 桂花糖铺子 2012-03-02 09:12:18
技术知识阅读增加。