pandas-dev · jreback · Jun 17, 2014 · Jun 10, 2014 · Jun 13, 2014 · Jun 13, 2014
diff --git a/doc/source/v0.14.1.txt b/doc/source/v0.14.1.txt
@@ -159,7 +159,7 @@ Bug Fixes
 
 
 
-
+- Bug in ``value_counts`` where ``NaT`` did not qualify as missing (``NaN``) (:issue:`7423`) 
 
 
 

diff --git a/pandas/core/algorithms.py b/pandas/core/algorithms.py
@@ -202,25 +202,27 @@ def value_counts(values, sort=True, ascending=False, normalize=False,
             raise TypeError("bins argument only works with numeric data.")
         values = cat.labels
 
-    if com.is_integer_dtype(values.dtype):
+    dtype = values.dtype
+    if com.is_integer_dtype(dtype):
         values = com._ensure_int64(values)
         keys, counts = htable.value_count_int64(values)
 
     elif issubclass(values.dtype.type, (np.datetime64, np.timedelta64)):
-        dtype = values.dtype
         values = values.view(np.int64)
         keys, counts = htable.value_count_int64(values)
 
+        from pandas.lib import NaT
+        msk = keys != NaT.value
+        keys, counts = keys[msk], counts[msk]
         # convert the keys back to the dtype we came in
-        keys = Series(keys, dtype=dtype)
+        keys = keys.astype(dtype)
 
     else:
         mask = com.isnull(values)
         values = com._ensure_object(values)
         keys, counts = htable.value_count_object(values, mask)
 
     result = Series(counts, index=com._values_from_object(keys))
-
     if bins is not None:
         # TODO: This next line should be more efficient
         result = result.reindex(np.arange(len(cat.levels)), fill_value=0)

diff --git a/pandas/tests/test_algos.py b/pandas/tests/test_algos.py
@@ -237,6 +237,20 @@ def test_value_counts_dtypes(self):
 
         self.assertRaises(TypeError, lambda s: algos.value_counts(s, bins=1), ['1', 1])
 
+    def test_value_counts_nat(self):
+        td = Series([np.timedelta64(10000), pd.NaT], dtype='timedelta64[ns]')
+        dt = pd.to_datetime(['NaT', '2014-01-01'])
+
+        res_td = algos.value_counts(td)
+        res_dt = algos.value_counts(dt)
+
+        self.assertEqual(len(res_td), 1)
+        self.assertEqual(len(res_dt), 1)
+
+        exp_dt = pd.Series({pd.Timestamp('2014-01-01 00:00:00'): 1})
+        tm.assert_series_equal(res_dt, exp_dt)
+
+        # TODO same for res_td (timedelta)
 
 def test_quantile():
     s = Series(np.random.randn(100))
Original file line number	Diff line number	Diff line change
Expand Up		@@ -159,7 +159,7 @@ Bug Fixes




		- Bug in ``value_counts`` where ``NaT`` did not qualify as missing (``NaN``) (:issue:`7423`)



Expand Down