Linux

Linux下文件的拆分以及随机取样

需求200W的文本文件,需要删除以某些字符开始的行,然后在剩下的文件中取4个10W的样本。样本不重复。 一开始觉得使用MySQL导入到数据库,发现速度太慢了。 所以使用先拆分后取样的方式,保证不重复即可,概率上可能会有所偏差,不影响结...

work

MySQL分解关联查询

很多高性能的应用都会对关联查询进行分解。简单地,可以对每一个表进行一次单表查询,然后将结果在应用程序中进行关联。例如,下面这个查询: 1234mysql> SELECT * FROM tag -> JOIN t...

Java

volatile

Java内存模型随着计算机的CPU的飞速发展,CPU的运算能力已经远远超出了从主内存(运行内存)中读取的数据的能力,为了解决这个问题,CPU厂商设计出了CPU内置高速缓存区。高速缓存区的加入使得CPU在运算的过程中直接从高速缓存区读取...