Content - b4d3df3d770dd050f57eb8147d6dbc9fad55cf1a - f8da4dc/Lib/ctypes/test/test_unicode.py

Staging
v0.5.1
visit type:
https://github.com/python/cpython

09 December 2020, 11:06:31 UTC
Tip revision: 36a6558891a010675cd2867a242055db113b7012 authored by Benjamin Peterson on 23 February 2012, 15:45:48 UTC
version now 3.1.5rc1
Tip revision: 36a6558
test_unicode.py
import unittest
import ctypes

try:
    ctypes.c_wchar
except AttributeError:
    pass
else:
    import _ctypes_test
    dll = ctypes.CDLL(_ctypes_test.__file__)
    wcslen = dll.my_wcslen
    wcslen.argtypes = [ctypes.c_wchar_p]


    class UnicodeTestCase(unittest.TestCase):
        def setUp(self):
            self.prev_conv_mode = ctypes.set_conversion_mode("ascii", "strict")

        def tearDown(self):
            ctypes.set_conversion_mode(*self.prev_conv_mode)

        def test_ascii_strict(self):
            ctypes.set_conversion_mode("ascii", "strict")
            # no conversions take place with unicode arguments
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("ab\u2070"), 3)
            # string args are converted
            self.assertEqual(wcslen("abc"), 3)
            self.assertRaises(ctypes.ArgumentError, wcslen, b"ab\xe4")

        def test_ascii_replace(self):
            ctypes.set_conversion_mode("ascii", "replace")
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("ab\u2070"), 3)
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("ab\xe4"), 3)

        def test_ascii_ignore(self):
            ctypes.set_conversion_mode("ascii", "ignore")
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("ab\u2070"), 3)
            # ignore error mode skips non-ascii characters
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen(b"\xe4\xf6\xfc\xdf"), 0)

        def test_latin1_strict(self):
            ctypes.set_conversion_mode("latin-1", "strict")
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("ab\u2070"), 3)
            self.assertEqual(wcslen("abc"), 3)
            self.assertEqual(wcslen("\xe4\xf6\xfc\xdf"), 4)

        def test_buffers(self):
            ctypes.set_conversion_mode("ascii", "strict")
            buf = ctypes.create_unicode_buffer("abc")
            self.assertEqual(len(buf), 3+1)

            ctypes.set_conversion_mode("ascii", "replace")
            buf = ctypes.create_unicode_buffer(b"ab\xe4\xf6\xfc")
            self.assertEqual(buf[:], "ab\uFFFD\uFFFD\uFFFD\0")
            self.assertEqual(buf[::], "ab\uFFFD\uFFFD\uFFFD\0")
            self.assertEqual(buf[::-1], "\0\uFFFD\uFFFD\uFFFDba")
            self.assertEqual(buf[::2], "a\uFFFD\uFFFD")
            self.assertEqual(buf[6:5:-1], "")

            ctypes.set_conversion_mode("ascii", "ignore")
            buf = ctypes.create_unicode_buffer(b"ab\xe4\xf6\xfc")
            # is that correct? not sure.  But with 'ignore', you get what you pay for..
            self.assertEqual(buf[:], "ab\0\0\0\0")
            self.assertEqual(buf[::], "ab\0\0\0\0")
            self.assertEqual(buf[::-1], "\0\0\0\0ba")
            self.assertEqual(buf[::2], "a\0\0")
            self.assertEqual(buf[6:5:-1], "")

    import _ctypes_test
    func = ctypes.CDLL(_ctypes_test.__file__)._testfunc_p_p

    class StringTestCase(UnicodeTestCase):
        def setUp(self):
            self.prev_conv_mode = ctypes.set_conversion_mode("ascii", "strict")
            func.argtypes = [ctypes.c_char_p]
            func.restype = ctypes.c_char_p

        def tearDown(self):
            ctypes.set_conversion_mode(*self.prev_conv_mode)
            func.argtypes = None
            func.restype = ctypes.c_int

        def test_ascii_replace(self):
            ctypes.set_conversion_mode("ascii", "strict")
            self.assertEqual(func("abc"), "abc")
            self.assertEqual(func("abc"), "abc")
            self.assertRaises(ctypes.ArgumentError, func, "ab\xe4")

        def test_ascii_ignore(self):
            ctypes.set_conversion_mode("ascii", "ignore")
            self.assertEqual(func("abc"), b"abc")
            self.assertEqual(func("abc"), b"abc")
            self.assertEqual(func("\xe4\xf6\xfc\xdf"), b"")

        def test_ascii_replace(self):
            ctypes.set_conversion_mode("ascii", "replace")
            self.assertEqual(func("abc"), b"abc")
            self.assertEqual(func("abc"), b"abc")
            self.assertEqual(func("\xe4\xf6\xfc\xdf"), b"????")

        def test_buffers(self):
            ctypes.set_conversion_mode("ascii", "strict")
            buf = ctypes.create_string_buffer("abc")
            self.assertEqual(len(buf), 3+1)

            ctypes.set_conversion_mode("ascii", "replace")
            buf = ctypes.create_string_buffer("ab\xe4\xf6\xfc")
            self.assertEqual(buf[:], b"ab???\0")
            self.assertEqual(buf[::], b"ab???\0")
            self.assertEqual(buf[::-1], b"\0???ba")
            self.assertEqual(buf[::2], b"a??")
            self.assertEqual(buf[6:5:-1], b"")

            ctypes.set_conversion_mode("ascii", "ignore")
            buf = ctypes.create_string_buffer("ab\xe4\xf6\xfc")
            # is that correct? not sure.  But with 'ignore', you get what you pay for..
            self.assertEqual(buf[:], b"ab\0\0\0\0")
            self.assertEqual(buf[::], b"ab\0\0\0\0")
            self.assertEqual(buf[::-1], b"\0\0\0\0ba")

if __name__ == '__main__':
    unittest.main()