LDA的全称是Linear Discriminant Analysis(线性判别分析),有些资料上也称为是Fisher’s Linear Discriminant,因为它被Ronald Fisher发明自1936年,它是一种监督学习方法。

阅读更多

Spark是什么

Apache Spark是一个新兴的大处理处理通用引擎,提供了分布式的内存抽象,适用于包括批处理、迭代算法、交互式查询、流处理等场景。spark扩展了广泛使用的MapReduce计算模型,而且高效的支持更多计算模式。Spark的一个主要特点就是能够在内存中进行计算,因而更快。不过即使是必须在磁盘上进行的复杂计算,Spark也比MapReduce更加高效。

阅读更多

概念

序列化:将对象转化为字节序列

反序列化:将字节序列恢复为对象

用途

  • 把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;

  • 在网络上传送对象的字节序列。

阅读更多

写博客的地方很多,新浪博客,百度空间,博客园,Jekyll,CSDN等等,但页面样式都不是很喜欢,有学长推荐Hexo,感觉很不错,所以决定就用它了。

Hexo是一款非常优秀的博客框架。用它官网上的话说就是快速、简洁和高效。我想它最吸引人的地方就是速度,渲染几百个页面只需要几秒钟的时间。

下面简单讲一下它的搭建过程。

阅读更多

从今天开始决定写博客了,其实很早之前就有写博客的打算,一方面是想提升自己的写作和总结能力,因为感觉自己写的文章真是有点渣,自己都不忍心看。另一方面也是为了给自己做笔记,因为发现做过的东西总是会忘掉,只留下一些模糊的印象。每次都需要花费额外的时间重新上手,消耗不少精力。我想最好的方法就是把做过的东西找一个地方记录下来,这样也方便及时的查阅与巩固,看自己的东西终究比看别人的要熟悉的多。

阅读更多

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

Quick Start

Create a new post

1
$ hexo new "My New Post"

More info: Writing

Run server

1
$ hexo server

More info: Server

Generate static files

1
$ hexo generate

More info: Generating

Deploy to remote sites

1
$ hexo deploy

More info: Deployment