Linux

Linux下文件的拆分以及随机取样

需求200W的文本文件,需要删除以某些字符开始的行,然后在剩下的文件中取4个10W的样本。样本不重复。 一开始觉得使用MySQL导入到数据库,发现速度太慢了。 所以使用先拆分后取样的方式,保证不重复即可,概率上可能会有所偏差,不影响结...

Linux

Linux下的权限

文件权限Linux系统中的每个文件和目录都有访问许可权限,用它来确定谁可以通过何种方式对文件和目录进行访问和操作。 文件或目录的访问权限分为只读,只写和可执行三种。以文件为例,只读权限表示只允许读其内容,而禁止对其做任何的更改操作。可...