查找两个大文件(1G以上)的相同内容PHP版 php笔记 20年3月26日 编辑 Simmoc站长 取消关注 关注 私信 释放双眼,带上耳机,听听看~! 顺序读取两个文件的的全部记录 将每条记录经过hash->转换为10进制->%n后存到10个文件中,这样一共2G的数据分成10份,每份就是204.8M,低于内存限制 我可以一次读取一个文件,并用hash桶的方式得到单个文件中的内容是否有重复,因为每条记录都经过hash处理的,所以相同的记录肯定会在同一个文件中。 给TA打赏 共{{data.count}}人 人已打赏 blog.simmoc.cnhashphp文件