pandas-dev
diff --git a/‎pandas/core/api.py
+2-2 b/‎pandas/core/api.py
+2-2
diff --git a/‎pandas/core/frame.py
+11-1 b/‎pandas/core/frame.py
+11-1
diff --git a/‎pandas/core/generic.py
+284-2 b/‎pandas/core/generic.py
+284-2
@@ -18,8 +18,8 @@
 from pandas.core.panel import Panel, WidePanel
 from pandas.core.panel4d import Panel4D
 from pandas.core.groupby import groupby
-from pandas.core.reshape import (pivot_simple as pivot, get_dummies,
-                                 lreshape, wide_to_long)
+from pandas.core.reshape import (pivot_simple as pivot, lreshape, wide_to_long)
+from pandas.core.generic import get_dummies
 
 from pandas.core.indexing import IndexSlice
 from pandas.tseries.offsets import DateOffset
 
@@ -112,7 +112,9 @@
     versionadded_crosstab='\n.. versionadded:: 0.20.0\n',
     other_crosstab='crosstab',
     versionadded_pivot_table='\n.. versionadded:: 0.20.0\n',
-    other_pivot_table='pivot_table')
+    other_pivot_table='pivot_table',
+    versionadded_get_dummies='\n.. versionadded:: 0.20.0\n',
+    other_get_dummies='get_dummies\nSeries.get_dummies')
 
 _numeric_only_doc = """numeric_only : boolean, default None
     Include only float, int, boolean data. If None, will attempt to use
@@ -4314,6 +4316,14 @@ def crosstab(self, columns, values=None, rownames=None, colnames=None,
                         colnames=colnames, aggfunc=aggfunc, margins=margins,
                         dropna=dropna, normalize=normalize)
 
+    @Appender(_shared_docs['get_dummies'] % _shared_doc_kwargs)
+    def get_dummies(self, prefix=None, prefix_sep='_', dummy_na=False,
+                    columns=None, sparse=False, drop_first=False):
+        from pandas.core.generic import get_dummies
+        return get_dummies(self, prefix=prefix, prefix_sep=prefix_sep,
+                           dummy_na=dummy_na, column=columns,
+                           sparse=sparse, drop_first=drop_first)
+
     # ----------------------------------------------------------------------
     # Time series-related
 
 
@@ -10,7 +10,6 @@
 
 import pandas as pd
 
-
 from pandas.types.common import (_coerce_to_dtype,
                                  _ensure_int64,
                                  needs_i8_conversion,
@@ -64,7 +63,10 @@
     args_transpose='axes to permute (int or label for object)',
     optional_by="""
         by : str or list of str
-            Name or list of names which refer to the axis items.""")
+            Name or list of names which refer to the axis items.""",
+    versionadded_get_dummies="",
+    other_get_dummies=""
+    )
 
 
 def _single_replace(self, to_replace, method, inplace, limit):
@@ -6069,3 +6071,283 @@ def logical_func(self, axis=None, bool_only=None, skipna=None, level=None,
 # install the indexes
 for _name, _indexer in indexing.get_indexers_list():
     NDFrame._create_indexer(_name, _indexer)
+
+
+_shared_docs['get_dummies'] = """
+Convert categorical variable into dummy/indicator variables
+
+%(versionadded_get_dummies)s
+
+Parameters
+----------
+data : array-like, Series, or DataFrame
+prefix : string, list of strings, or dict of strings, default None
+    String to append DataFrame column names
+    Pass a list with length equal to the number of columns
+    when calling get_dummies on a DataFrame. Alternativly, `prefix`
+    can be a dictionary mapping column names to prefixes.
+prefix_sep : string, default '_'
+    If appending prefix, separator/delimiter to use. Or pass a
+    list or dictionary as with `prefix.`
+dummy_na : bool, default False
+    Add a column to indicate NaNs, if False NaNs are ignored.
+columns : list-like, default None
+    Column names in the DataFrame to be encoded.
+    If `columns` is None then all the columns with
+    `object` or `category` dtype will be converted.
+sparse : bool, default False
+    Whether the dummy columns should be sparse or not.  Returns
+    SparseDataFrame if `data` is a Series or if all columns are included.
+    Otherwise returns a DataFrame with some SparseBlocks.
+
+    .. versionadded:: 0.16.1
+drop_first : bool, default False
+    Whether to get k-1 dummies out of k categorical levels by removing the
+    first level.
+
+    .. versionadded:: 0.18.0
+Returns
+-------
+dummies : DataFrame or SparseDataFrame
+
+Examples
+--------
+>>> import pandas as pd
+>>> s = pd.Series(list('abca'))
+
+>>> pd.get_dummies(s)
+   a  b  c
+0  1  0  0
+1  0  1  0
+2  0  0  1
+3  1  0  0
+
+>>> s1 = ['a', 'b', np.nan]
+
+>>> pd.get_dummies(s1)
+   a  b
+0  1  0
+1  0  1
+2  0  0
+
+>>> pd.get_dummies(s1, dummy_na=True)
+   a  b  NaN
+0  1  0    0
+1  0  1    0
+2  0  0    1
+
+>>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
+                    'C': [1, 2, 3]})
+
+>>> pd.get_dummies(df, prefix=['col1', 'col2'])
+   C  col1_a  col1_b  col2_a  col2_b  col2_c
+0  1       1       0       0       1       0
+1  2       0       1       1       0       0
+2  3       1       0       0       0       1
+
+>>> pd.get_dummies(pd.Series(list('abcaa')))
+   a  b  c
+0  1  0  0
+1  0  1  0
+2  0  0  1
+3  1  0  0
+4  1  0  0
+
+>>> pd.get_dummies(pd.Series(list('abcaa')), drop_first=True))
+   b  c
+0  0  0
+1  1  0
+2  0  1
+3  0  0
+4  0  0
+
+See Also
+--------
+%(other_get_dummies)s
+Series.str.get_dummies
+"""
+
+
+@Appender(_shared_docs['get_dummies'] % _shared_doc_kwargs)
+def get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False,
+                columns=None, sparse=False, drop_first=False):
+    from pandas.tools.concat import concat
+    from itertools import cycle
+    from pandas.core.frame import DataFrame
+
+    if isinstance(data, DataFrame):
+        # determine columns being encoded
+
+        if columns is None:
+            columns_to_encode = data.select_dtypes(
+                include=['object', 'category']).columns
+        else:
+            columns_to_encode = columns
+
+        # validate prefixes and separator to avoid silently dropping cols
+        def check_len(item, name):
+            length_msg = ("Length of '{0}' ({1}) did not match the length of "
+                          "the columns being encoded ({2}).")
+
+            if is_list_like(item):
+                if not len(item) == len(columns_to_encode):
+                    raise ValueError(length_msg.format(name, len(item),
+                                                       len(columns_to_encode)))
+
+        check_len(prefix, 'prefix')
+        check_len(prefix_sep, 'prefix_sep')
+        if isinstance(prefix, compat.string_types):
+            prefix = cycle([prefix])
+        if isinstance(prefix, dict):
+            prefix = [prefix[col] for col in columns_to_encode]
+
+        if prefix is None:
+            prefix = columns_to_encode
+
+        # validate separators
+        if isinstance(prefix_sep, compat.string_types):
+            prefix_sep = cycle([prefix_sep])
+        elif isinstance(prefix_sep, dict):
+            prefix_sep = [prefix_sep[col] for col in columns_to_encode]
+
+        if set(columns_to_encode) == set(data.columns):
+            with_dummies = []
+        else:
+            with_dummies = [data.drop(columns_to_encode, axis=1)]
+
+        for (col, pre, sep) in zip(columns_to_encode, prefix, prefix_sep):
+
+            dummy = _get_dummies_1d(data[col], prefix=pre, prefix_sep=sep,
+                                    dummy_na=dummy_na, sparse=sparse,
+                                    drop_first=drop_first)
+            with_dummies.append(dummy)
+        result = concat(with_dummies, axis=1)
+    else:
+        result = _get_dummies_1d(data, prefix, prefix_sep, dummy_na,
+                                 sparse=sparse, drop_first=drop_first)
+    return result
+
+
+def _get_dummies_1d(data, prefix, prefix_sep='_', dummy_na=False,
+                    sparse=False, drop_first=False):
+    from pandas.core.sparse import SparseDataFrame, SparseSeries
+    from pandas.sparse.array import SparseArray
+    from pandas._sparse import IntIndex
+    from pandas.core.series import Series
+    from pandas.core.frame import DataFrame
+
+    from pandas.core.categorical import _factorize_from_iterable
+    # Series avoids inconsistent NaN handling
+    codes, levels = _factorize_from_iterable(Series(data))
+
+    def get_empty_Frame(data, sparse):
+        if isinstance(data, Series):
+            index = data.index
+        else:
+            index = np.arange(len(data))
+        if not sparse:
+            return DataFrame(index=index)
+        else:
+            return SparseDataFrame(index=index)
+
+    # if all NaN
+    if not dummy_na and len(levels) == 0:
+        return get_empty_Frame(data, sparse)
+
+    codes = codes.copy()
+    if dummy_na:
+        codes[codes == -1] = len(levels)
+        levels = np.append(levels, np.nan)
+
+    # if dummy_na, we just fake a nan level. drop_first will drop it again
+    if drop_first and len(levels) == 1:
+        return get_empty_Frame(data, sparse)
+
+    number_of_cols = len(levels)
+
+    if prefix is not None:
+        dummy_cols = ['%s%s%s' % (prefix, prefix_sep, v) for v in levels]
+    else:
+        dummy_cols = levels
+
+    if isinstance(data, Series):
+        index = data.index
+    else:
+        index = None
+
+    if sparse:
+        sparse_series = {}
+        N = len(data)
+        sp_indices = [[] for _ in range(len(dummy_cols))]
+        for ndx, code in enumerate(codes):
+            if code == -1:
+                # Blank entries if not dummy_na and code == -1, #GH4446
+                continue
+            sp_indices[code].append(ndx)
+
+        if drop_first:
+            # remove first categorical level to avoid perfect collinearity
+            # GH12042
+            sp_indices = sp_indices[1:]
+            dummy_cols = dummy_cols[1:]
+        for col, ixs in zip(dummy_cols, sp_indices):
+            sarr = SparseArray(np.ones(len(ixs), dtype=np.uint8),
+                               sparse_index=IntIndex(N, ixs), fill_value=0,
+                               dtype=np.uint8)
+            sparse_series[col] = SparseSeries(data=sarr, index=index)
+
+        out = SparseDataFrame(sparse_series, index=index, columns=dummy_cols,
+                                 dtype=np.uint8)
+        return out
+
+    else:
+        dummy_mat = np.eye(number_of_cols, dtype=np.uint8).take(codes, axis=0)
+
+        if not dummy_na:
+            # reset NaN GH4446
+            dummy_mat[codes == -1] = 0
+
+        if drop_first:
+            # remove first GH12042
+            dummy_mat = dummy_mat[:, 1:]
+            dummy_cols = dummy_cols[1:]
+        return DataFrame(dummy_mat, index=index, columns=dummy_cols)
+
+
+def make_axis_dummies(frame, axis='minor', transform=None):
+    """
+    Construct 1-0 dummy variables corresponding to designated axis
+    labels
+
+    Parameters
+    ----------
+    frame : DataFrame
+    axis : {'major', 'minor'}, default 'minor'
+    transform : function, default None
+        Function to apply to axis labels first. For example, to
+        get "day of week" dummies in a time series regression
+        you might call::
+
+            make_axis_dummies(panel, axis='major',
+                              transform=lambda d: d.weekday())
+    Returns
+    -------
+    dummies : DataFrame
+        Column names taken from chosen axis
+    """
+    from pandas.core.frame import DataFrame
+    from pandas.core.categorical import _factorize_from_iterable
+
+    numbers = {'major': 0, 'minor': 1}
+    num = numbers.get(axis, axis)
+
+    items = frame.index.levels[num]
+    labels = frame.index.labels[num]
+    if transform is not None:
+        mapped_items = items.map(transform)
+        labels, items = _factorize_from_iterable(mapped_items.take(labels))
+
+    values = np.eye(len(items), dtype=float)
+    values = values.take(labels, axis=0)
+
+    return DataFrame(values, columns=items, index=frame.index)