pandas-dev · jreback · May 17, 2021 · May 14, 2021 · May 14, 2021
diff --git a/pandas/tests/strings/test_case_justify.py b/pandas/tests/strings/test_case_justify.py
@@ -49,10 +49,21 @@ def test_lower_upper_mixed_object():
     tm.assert_series_equal(result, expected)
 
 
-def test_capitalize(any_string_dtype):
-    s = Series(["FOO", "BAR", np.nan, "Blah", "blurg"], dtype=any_string_dtype)
+@pytest.mark.parametrize(
+    "data, expected",
+    [
+        (
+            ["FOO", "BAR", np.nan, "Blah", "blurg"],
+            ["Foo", "Bar", np.nan, "Blah", "Blurg"],
+        ),
+        (["a", "b", "c"], ["A", "B", "C"]),
+        (["a b", "a bc. de"], ["A b", "A bc. de"]),
+    ],
+)
+def test_capitalize(data, expected, any_string_dtype):
+    s = Series(data, dtype=any_string_dtype)
     result = s.str.capitalize()
-    expected = Series(["Foo", "Bar", np.nan, "Blah", "Blurg"], dtype=any_string_dtype)
+    expected = Series(expected, dtype=any_string_dtype)
     tm.assert_series_equal(result, expected)
 
 

diff --git a/pandas/tests/strings/test_split_partition.py b/pandas/tests/strings/test_split_partition.py
@@ -614,56 +614,61 @@ def test_partition_sep_kwarg(any_string_dtype):
 
 
 def test_get():
-    values = Series(["a_b_c", "c_d_e", np.nan, "f_g_h"])
-
-    result = values.str.split("_").str.get(1)
+    ser = Series(["a_b_c", "c_d_e", np.nan, "f_g_h"])
+    result = ser.str.split("_").str.get(1)
     expected = Series(["b", "d", np.nan, "g"])
     tm.assert_series_equal(result, expected)
 
-    # mixed
-    mixed = Series(["a_b_c", np.nan, "c_d_e", True, datetime.today(), None, 1, 2.0])
 
-    rs = Series(mixed).str.split("_").str.get(1)
-    xp = Series(["b", np.nan, "d", np.nan, np.nan, np.nan, np.nan, np.nan])
+def test_get_mixed_object():
+    ser = Series(["a_b_c", np.nan, "c_d_e", True, datetime.today(), None, 1, 2.0])
+    result = ser.str.split("_").str.get(1)
+    expected = Series(["b", np.nan, "d", np.nan, np.nan, np.nan, np.nan, np.nan])
+    tm.assert_series_equal(result, expected)
 
-    assert isinstance(rs, Series)
-    tm.assert_almost_equal(rs, xp)
 
-    # bounds testing
-    values = Series(["1_2_3_4_5", "6_7_8_9_10", "11_12"])
+def test_get_bounds():
+    ser = Series(["1_2_3_4_5", "6_7_8_9_10", "11_12"])
 
     # positive index
-    result = values.str.split("_").str.get(2)
+    result = ser.str.split("_").str.get(2)
     expected = Series(["3", "8", np.nan])
     tm.assert_series_equal(result, expected)
 
     # negative index
-    result = values.str.split("_").str.get(-3)
+    result = ser.str.split("_").str.get(-3)
     expected = Series(["3", "8", np.nan])
     tm.assert_series_equal(result, expected)
 
 
 def test_get_complex():
     # GH 20671, getting value not in dict raising `KeyError`
-    values = Series([(1, 2, 3), [1, 2, 3], {1, 2, 3}, {1: "a", 2: "b", 3: "c"}])
+    ser = Series([(1, 2, 3), [1, 2, 3], {1, 2, 3}, {1: "a", 2: "b", 3: "c"}])
 
-    result = values.str.get(1)
+    result = ser.str.get(1)
     expected = Series([2, 2, np.nan, "a"])
     tm.assert_series_equal(result, expected)
 
-    result = values.str.get(-1)
+    result = ser.str.get(-1)
     expected = Series([3, 3, np.nan, np.nan])
     tm.assert_series_equal(result, expected)
 
 
 @pytest.mark.parametrize("to_type", [tuple, list, np.array])
 def test_get_complex_nested(to_type):
-    values = Series([to_type([to_type([1, 2])])])
+    ser = Series([to_type([to_type([1, 2])])])
 
-    result = values.str.get(0)
+    result = ser.str.get(0)
     expected = Series([to_type([1, 2])])
     tm.assert_series_equal(result, expected)
 
-    result = values.str.get(1)
+    result = ser.str.get(1)
     expected = Series([np.nan])
     tm.assert_series_equal(result, expected)
+
+
+def test_get_strings(any_string_dtype):
+    ser = Series(["a", "ab", np.nan, "abc"], dtype=any_string_dtype)
+    result = ser.str.get(2)
+    expected = Series([np.nan, np.nan, np.nan, "c"], dtype=any_string_dtype)
+    tm.assert_series_equal(result, expected)
diff --git a/pandas/tests/strings/test_string_array.py b/pandas/tests/strings/test_string_array.py
@@ -1,11 +1,8 @@
-import operator
-
 import numpy as np
 import pytest
 
 from pandas._libs import lib
 
-import pandas as pd
 from pandas import (
     DataFrame,
     Series,
@@ -99,27 +96,3 @@ def test_string_array_extract(nullable_string_dtype):
 
     result = result.astype(object)
     tm.assert_equal(result, expected)
-
-
-def test_str_get_stringarray_multiple_nans(nullable_string_dtype):
-    s = Series(pd.array(["a", "ab", pd.NA, "abc"], dtype=nullable_string_dtype))
-    result = s.str.get(2)
-    expected = Series(pd.array([pd.NA, pd.NA, pd.NA, "c"], dtype=nullable_string_dtype))
-    tm.assert_series_equal(result, expected)
-
-
-@pytest.mark.parametrize(
-    "input, method",
-    [
-        (["a", "b", "c"], operator.methodcaller("capitalize")),
-        (["a b", "a bc. de"], operator.methodcaller("capitalize")),
-    ],
-)
-def test_capitalize(input, method, nullable_string_dtype):
-    a = Series(input, dtype=nullable_string_dtype)
-    b = Series(input, dtype="object")
-    result = method(a.str)
-    expected = method(b.str)
-
-    assert result.dtype.name == nullable_string_dtype
-    tm.assert_series_equal(result.astype(object), expected)