Roach's Blog

努力,为了可以做自己想做的事情

Linux command learning

step by step, bit by bit

To love it! fg 当用 Ctrl+Z 挂起一个程序,这时你可以使用 fg 让它重新在前台运行,也可以使用 bg 让它在后台运行; jobs 命令可以看当前有那些后台任务,每个列出的任务前面有命令编号;可以根据编号结合 fg 选择将哪个任务重新放回前台; 当需要关闭一个后台进程时,可以 kill it by pid,同样可以使用命令 kill %num,其中 num...

Python 成长记

学习Python一部分原因是因为machine learning

Programming is fun When the work is done if you wanna make your work also fun: use Python! 类 (im)mutable Python的数据类型分为可变类型(mutable)与不可变类型(immutable)。不可变类型包含字符串(str),整数(int),元组(tu...

得到5个元素的全序最坏最少需要几次比较操作

比较排序方法的思考

快速排序、堆排序、归并排序、插入排序、选择排序、冒泡排序,都是基于比较的排序方法。比较排序的下线是O(nlogn),即在最差情况下,任何一种比较排序至少需要O(nlogn)比较操作。 5个元素7次比较 比较排序的下限 5个元素7次比较 先说一下,3个元素排序至少需要几次比较操作?3次!这个很简单。那么4个元素呢?5次。一种方法是按照归并排序的思想:把4个元素划分成两...

C++ 拾遗

学好一门语言

编者按 C++ 拾遗,这篇 post 是我学习 C++ 的笔记,或者是对学习 C++ 的过程中所遇问题的解决方法的记录。这样的话篇幅会越来越长,本来打算将其拆分变成一个系列。但是GitBook,感觉很合适我的需要,并且又接触了新的东西,所以就将这个系列迁移到了 GitBook 上,本 post 不再更新。 看看 GitBook 上的我 ^o^. GitBook 使用教程,一眼了解Git...

数据规范化的方法

数据挖掘 & 机器学习

感觉这是机器学习重要的一环,又是一个坑。 说数据规范化是坑是因为规范化、标准化、归一化傻傻分不清。数据标准化/归一化方法(Normalization Method)汇总这一篇貌似还好一点。 在机器学习中数据所用的度量单位可能影响数据分析。例如,把height的度量单位从米变成英寸,把weight的度量单位从公斤改成磅,可能导致完全不同的结果。一般而言,用较小的单位表示属性将导致该...

假设检验 p 值法

数据处理的统计学方法

Be happy! 假设检验的p值法 假设检验问题的 $p$ 值法 举个例子: 设总体 \(\small X \sim N(\mu,\sigma^2),\mu\)未知,\(\small \sigma^2 = 100\),现有样本 $x_1,x_2,…,x_{52}$,算得$\bar x = 62.75$。现在来检验假设 \[H_0:\mu\leqslant\mu_0...

Non-parametric test

假设检验——非参数检验方法

假设检验分参数检验和非参数检验,这一篇是常用的非参数检验方法。 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。 非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一...