我有一个
PHP脚本读取大型CSV并执行某些操作,但只有“username”字段是唯一的. CSV用于多个脚本,因此将CSV中的输入更改为仅包含唯一的用户名不是一个选项.
非常基本的程序流程(我正在想)就像这样:
$allUsernames = array(); while($row = fgetcsv($fp)) { $username = $row[0]; if (in_array($username,$allUsernames)) continue; $allUsernames[] = $username; // process this row }
由于这个CSV实际上可能相当大,所以我想到的是in_array位.在数组中搜索成员最理想的情况是,如果已经排序了,那么你将如何从头开始构建一个数组,保持顺序?一旦它是有序的,会有一个更有效的方式来搜索它,而不是使用in_array(),考虑到它可能不知道数组是排序的?
不保持阵列顺序,但是这样的优化呢?我猜猜数组键的isset()应该比in_array()搜索要快.
$allUsernames = array(); while($row = fgetcsv($fp)) { $username = $row[0]; if (isset($allUsernames[$username])) { continue; } else { $allUsernames[$username] = true; // do stuff } }