pandas-dev · jreback · Dec 5, 2018 · Dec 4, 2018 · Dec 4, 2018 · Dec 4, 2018
diff --git a/pandas/core/frame.py b/pandas/core/frame.py
@@ -470,6 +470,7 @@ def _init_dict(self, data, index, columns, dtype=None):
         Segregate Series based on type and coerce into matrices.
         Needs to handle a lot of exceptional cases.
         """
+
         if columns is not None:
             arrays = Series(data, index=columns, dtype=object)
             data_names = arrays.index
@@ -494,6 +495,11 @@ def _init_dict(self, data, index, columns, dtype=None):
                 arrays.loc[missing] = [v] * missing.sum()
 
         else:
+            for key in data:
+                if isinstance(data[key], ABCIndexClass):
+                    # GH#24096 need copy to be deep for datetime64tz case
+                    data[key] = data[key].copy(deep=True)
+
             keys = com.dict_keys_to_ordered_list(data)
             columns = data_names = Index(keys)
             arrays = [data[k] for k in keys]
@@ -556,7 +562,6 @@ def _get_axes(N, K, index=index, columns=columns):
         # by definition an array here
         # the dtypes will be coerced to a single dtype
         values = _prep_ndarray(values, copy=copy)
-
         if dtype is not None:
             if not is_dtype_equal(values.dtype, dtype):
                 try:

diff --git a/pandas/core/internals/blocks.py b/pandas/core/internals/blocks.py
@@ -2923,7 +2923,9 @@ def _try_coerce_result(self, result):
             # allow passing of > 1dim if its trivial
             if result.ndim > 1:
                 result = result.reshape(np.prod(result.shape))
-            result = self.values._shallow_copy(result)
+
+            # GH#24096 new values invalidates a frequency
+            result = self.values._shallow_copy(result, freq=None)
 
         return result
 

diff --git a/pandas/core/series.py b/pandas/core/series.py
@@ -29,7 +29,8 @@
     is_integer, is_integer_dtype, is_iterator, is_list_like, is_object_dtype,
     is_scalar, is_string_like, is_timedelta64_dtype, pandas_dtype)
 from pandas.core.dtypes.generic import (
-    ABCDataFrame, ABCIndexClass, ABCSeries, ABCSparseArray, ABCSparseSeries)
+    ABCDataFrame, ABCDatetimeIndex, ABCIndexClass, ABCSeries, ABCSparseArray,
+    ABCSparseSeries)
 from pandas.core.dtypes.missing import (
     isna, na_value_for_dtype, notna, remove_na_arraylike)
 
@@ -189,6 +190,9 @@ def __init__(self, data=None, index=None, dtype=None, name=None,
                 else:
                     # need to copy to avoid aliasing issues
                     data = data._values.copy()
+                    if isinstance(data, ABCDatetimeIndex):
+                        # GH#24096 need copy to be deep for datetime64tz case
+                        data = data._values.copy(deep=True)
                 copy = False
 
             elif isinstance(data, np.ndarray):

diff --git a/pandas/tests/frame/test_block_internals.py b/pandas/tests/frame/test_block_internals.py
@@ -28,6 +28,51 @@
 
 
 class TestDataFrameBlockInternals():
+    def test_setitem_invalidates_datetime_index_freq(self):
+        # GH#24096 altering a datetime64tz column inplace invalidates the
+        #  `freq` attribute on the underlying DatetimeIndex
+
+        dti = date_range('20130101', periods=3, tz='US/Eastern')
+        ts = dti[1]
+
+        df = DataFrame({'B': dti})
+        assert df['B']._values.freq == 'D'
+
+        df.iloc[1, 0] = pd.NaT
+        assert df['B']._values.freq is None
+
+        # check that the DatetimeIndex was not altered in place
+        assert dti.freq == 'D'
+        assert dti[1] == ts
+
+        dti = date_range('20130101', periods=3, tz='US/Eastern')
+        ts = dti[1]
+        ser = Series(dti)
+        assert ser._values is not dti
+        assert ser._values._data.base is not dti._data.base
+        assert dti.freq == 'D'
+        ser.iloc[1] = pd.NaT
+        assert ser._values.freq is None
+
+        # check that the DatetimeIndex was not altered in place
+        assert ser._values is not dti
+        assert ser._values._data.base is not dti._data.base
+        assert dti[1] == ts
+        assert dti.freq == 'D'
+
+    def test_dt64tz_setitem_does_not_mutate_dti(self):
+        # GH#21907, GH#24096
+        dti = pd.date_range('2016-01-01', periods=10, tz='US/Pacific')
+        ts = dti[0]
+        ser = pd.Series(dti)
+        assert ser._values is not dti
+        assert ser._values._data.base is not dti._data.base
+        assert ser._data.blocks[0].values is not dti
+        assert ser._data.blocks[0].values._data.base is not dti._data.base
+
+        ser[::3] = pd.NaT
+        assert ser[0] is pd.NaT
+        assert dti[0] == ts
 
     def test_cast_internals(self, float_frame):
         casted = DataFrame(float_frame._data, dtype=int)