H 指数

2025年5月19日

分析

这道题的难点在于如何高效找到 H 指数。一开始我是想到了利用计数排序来实现：通过引入一个额外的数组 nums[]，用类似我们之前建立 Hash Table 的方法来记录引用次数。其中，nums[i] 用于表示引用次数恰好为 $i$ 的论文数。考虑到 H 指数不可能大于论文发表数，所以我们可以将所有引用次数超过论文发表数的算入总发表数（即 nums[nums.length]）。接着，我们可以逆序遍历这个数组，当“引用次数至少为当前值”的论文数量不少于当前值时，即为我们所求的 H 指数。

当然，这个方法虽然很快，但要引入一个辅助数组，这增加了空间复杂度。因此，我们需要找到一个更好的方法。我们可以将问题转换为寻找「有 h 篇论文引用次数至少为 h」的最大值。因此，我们可以利用二分查找快速寻找出这个最大值。当 left = right 时，此时 left 即为所求。解答如下文所示。

解答

1
class Solution {
2
public:
3
  int hIndex(vector<int> &citations) {
4
    auto left = 0;
5
    auto right = citations.size();
6

7
    while (left < right) {
8
      auto mid = (left + right + 1) >> 1;
9
      auto cnt = count_if(citations.begin(), citations.end(),
10
                          [mid](auto val) { return val >= mid; });
11
      if (cnt >= mid)
12
        left = mid;
13
      else
14
        right = mid - 1;
15
    }
16
    return left;
17
  }
18
};