1 files changed, 86 insertions, 61 deletions
diff --git a/tests/test_basic_api.py b/tests/test_basic_api.py
index 00dc26f0..7485df1a 100644
--- a/tests/test_basic_api.py
+++ b/tests/test_basic_api.py
@@ -3,11 +3,12 @@
     Pygments basic API tests
     ~~~~~~~~~~~~~~~~~~~~~~~~
 
-    :copyright: Copyright 2006-2013 by the Pygments team, see AUTHORS.
+    :copyright: Copyright 2006-2014 by the Pygments team, see AUTHORS.
     :license: BSD, see LICENSE for details.
 """
 
-import os
+from __future__ import print_function
+
 import random
 import unittest
 
@@ -15,7 +16,7 @@ from pygments import lexers, formatters, filters, format
 from pygments.token import _TokenType, Text
 from pygments.lexer import RegexLexer
 from pygments.formatters.img import FontNotFound
-from pygments.util import BytesIO, StringIO, bytes, b
+from pygments.util import text_type, StringIO, BytesIO, xrange, ClassNotFound
 
 import support
 
@@ -26,10 +27,12 @@ random.shuffle(test_content)
 test_content = ''.join(test_content) + '\n'
 
 
-def test_lexer_import_all():
+def test_lexer_instantiate_all():
     # instantiate every lexer, to see if the token type defs are correct
-    for x in lexers.LEXERS.keys():
-        c = getattr(lexers, x)()
+    def verify(name):
+        getattr(lexers, name)
+    for x in lexers.LEXERS:
+        yield verify, x
 
 
 def test_lexer_classes():
@@ -39,12 +42,14 @@ def test_lexer_classes():
         for attr in 'aliases', 'filenames', 'alias_filenames', 'mimetypes':
             assert hasattr(cls, attr)
             assert type(getattr(cls, attr)) is list, \
-                   "%s: %s attribute wrong" % (cls, attr)
+                "%s: %s attribute wrong" % (cls, attr)
         result = cls.analyse_text("abc")
         assert isinstance(result, float) and 0.0 <= result <= 1.0
         result = cls.analyse_text(".abc")
         assert isinstance(result, float) and 0.0 <= result <= 1.0
 
+        assert all(al.lower() == al for al in cls.aliases)
+
         inst = cls(opt1="val1", opt2="val2")
         if issubclass(cls, RegexLexer):
             if not hasattr(cls, '_tokens'):
@@ -60,19 +65,22 @@ def test_lexer_classes():
         if cls.name in ['XQuery', 'Opa']:   # XXX temporary
             return
 
-        tokens = list(inst.get_tokens(test_content))
+        try:
+            tokens = list(inst.get_tokens(test_content))
+        except KeyboardInterrupt:
+            raise KeyboardInterrupt(
+                'interrupted %s.get_tokens(): test_content=%r' %
+                (cls.__name__, test_content))
         txt = ""
         for token in tokens:
             assert isinstance(token, tuple)
             assert isinstance(token[0], _TokenType)
-            if isinstance(token[1], str):
-                print repr(token[1])
-            assert isinstance(token[1], unicode)
+            assert isinstance(token[1], text_type)
             txt += token[1]
         assert txt == test_content, "%s lexer roundtrip failed: %r != %r" % \
-               (cls.name, test_content, txt)
+            (cls.name, test_content, txt)
 
-    for lexer in lexers._iter_lexerclasses():
+    for lexer in lexers._iter_lexerclasses(plugins=False):
         yield verify, lexer
 
 
@@ -81,7 +89,8 @@ def test_lexer_options():
     def ensure(tokens, output):
         concatenated = ''.join(token[1] for token in tokens)
         assert concatenated == output, \
-               '%s: %r != %r' % (lexer, concatenated, output)
+            '%s: %r != %r' % (lexer, concatenated, output)
+
     def verify(cls):
         inst = cls(stripnl=False)
         ensure(inst.get_tokens('a\nb'), 'a\nb\n')
@@ -90,17 +99,18 @@ def test_lexer_options():
         ensure(inst.get_tokens('   \n  b\n\n\n'), 'b\n')
         # some lexers require full lines in input
         if cls.__name__ not in (
-            'PythonConsoleLexer', 'RConsoleLexer', 'RubyConsoleLexer',
-            'SqliteConsoleLexer', 'MatlabSessionLexer', 'ErlangShellLexer',
-            'BashSessionLexer', 'LiterateHaskellLexer', 'PostgresConsoleLexer',
-            'ElixirConsoleLexer', 'JuliaConsoleLexer', 'RobotFrameworkLexer',
-            'DylanConsoleLexer', 'ShellSessionLexer'):
+                'PythonConsoleLexer', 'RConsoleLexer', 'RubyConsoleLexer',
+                'SqliteConsoleLexer', 'MatlabSessionLexer', 'ErlangShellLexer',
+                'BashSessionLexer', 'LiterateHaskellLexer', 'LiterateAgdaLexer',
+                'PostgresConsoleLexer', 'ElixirConsoleLexer', 'JuliaConsoleLexer',
+                'RobotFrameworkLexer', 'DylanConsoleLexer', 'ShellSessionLexer',
+                'LiterateIdrisLexer', 'LiterateCryptolLexer'):
             inst = cls(ensurenl=False)
             ensure(inst.get_tokens('a\nb'), 'a\nb')
             inst = cls(ensurenl=False, stripall=True)
             ensure(inst.get_tokens('a\nb\n\n'), 'a\nb')
 
-    for lexer in lexers._iter_lexerclasses():
+    for lexer in lexers._iter_lexerclasses(plugins=False):
         if lexer.__name__ == 'RawTokenLexer':
             # this one is special
             continue
@@ -122,7 +132,7 @@ def test_get_lexers():
                        ]:
         yield verify, func, args
 
-    for cls, (_, lname, aliases, _, mimetypes) in lexers.LEXERS.iteritems():
+    for cls, (_, lname, aliases, _, mimetypes) in lexers.LEXERS.items():
         assert cls == lexers.find_lexer_class(lname).__name__
 
         for alias in aliases:
@@ -131,34 +141,47 @@ def test_get_lexers():
         for mimetype in mimetypes:
             assert cls == lexers.get_lexer_for_mimetype(mimetype).__class__.__name__
 
+    try:
+        lexers.get_lexer_by_name(None)
+    except ClassNotFound:
+        pass
+    else:
+        raise Exception
+
 
 def test_formatter_public_api():
-    ts = list(lexers.PythonLexer().get_tokens("def f(): pass"))
-    out = StringIO()
     # test that every formatter class has the correct public API
-    def verify(formatter, info):
-        assert len(info) == 4
-        assert info[0], "missing formatter name"
-        assert info[1], "missing formatter aliases"
-        assert info[3], "missing formatter docstring"
-
-        if formatter.name == 'Raw tokens':
-            # will not work with Unicode output file
-            return
+    ts = list(lexers.PythonLexer().get_tokens("def f(): pass"))
+    string_out = StringIO()
+    bytes_out = BytesIO()
+
+    def verify(formatter):
+        info = formatters.FORMATTERS[formatter.__name__]
+        assert len(info) == 5
+        assert info[1], "missing formatter name"
+        assert info[2], "missing formatter aliases"
+        assert info[4], "missing formatter docstring"
 
         try:
             inst = formatter(opt1="val1")
         except (ImportError, FontNotFound):
-            return
+            raise support.SkipTest
+
         try:
             inst.get_style_defs()
         except NotImplementedError:
             # may be raised by formatters for which it doesn't make sense
             pass
-        inst.format(ts, out)
 
-    for formatter, info in formatters.FORMATTERS.iteritems():
-        yield verify, formatter, info
+        if formatter.unicodeoutput:
+            inst.format(ts, string_out)
+        else:
+            inst.format(ts, bytes_out)
+
+    for name in formatters.FORMATTERS:
+        formatter = getattr(formatters, name)
+        yield verify, formatter
+
 
 def test_formatter_encodings():
     from pygments.formatters import HtmlFormatter
@@ -167,7 +190,7 @@ def test_formatter_encodings():
     fmt = HtmlFormatter()
     tokens = [(Text, u"ä")]
     out = format(tokens, fmt)
-    assert type(out) is unicode
+    assert type(out) is text_type
     assert u"ä" in out
 
     # encoding option
@@ -191,12 +214,12 @@ def test_formatter_unicode_handling():
             inst = formatter(encoding=None)
         except (ImportError, FontNotFound):
             # some dependency or font not installed
-            return
+            raise support.SkipTest
 
         if formatter.name != 'Raw tokens':
             out = format(tokens, inst)
             if formatter.unicodeoutput:
-                assert type(out) is unicode
+                assert type(out) is text_type, '%s: %r' % (formatter, out)
 
             inst = formatter(encoding='utf-8')
             out = format(tokens, inst)
@@ -208,8 +231,10 @@ def test_formatter_unicode_handling():
             out = format(tokens, inst)
             assert type(out) is bytes, '%s: %r' % (formatter, out)
 
-    for formatter, info in formatters.FORMATTERS.iteritems():
-        yield verify, formatter
+    for formatter, info in formatters.FORMATTERS.items():
+        # this tests the automatic importing as well
+        fmter = getattr(formatters, formatter)
+        yield verify, fmter
 
 
 def test_get_formatters():
@@ -226,27 +251,33 @@ def test_get_formatters():
 def test_styles():
     # minimal style test
     from pygments.formatters import HtmlFormatter
-    fmt = HtmlFormatter(style="pastie")
+    HtmlFormatter(style="pastie")
 
 
 class FiltersTest(unittest.TestCase):
 
     def test_basic(self):
-        filter_args = {
-            'whitespace': {'spaces': True, 'tabs': True, 'newlines': True},
-            'highlight': {'names': ['isinstance', 'lexers', 'x']},
-        }
-        for x in filters.FILTERS.keys():
+        filters_args = [
+            ('whitespace', {'spaces': True, 'tabs': True, 'newlines': True}),
+            ('whitespace', {'wstokentype': False, 'spaces': True}),
+            ('highlight', {'names': ['isinstance', 'lexers', 'x']}),
+            ('codetagify', {'codetags': 'API'}),
+            ('keywordcase', {'case': 'capitalize'}),
+            ('raiseonerror', {}),
+            ('gobble', {'n': 4}),
+            ('tokenmerge', {}),
+        ]
+        for x, args in filters_args:
             lx = lexers.PythonLexer()
-            lx.add_filter(x, **filter_args.get(x, {}))
-            fp = open(TESTFILE, 'rb')
-            try:
+            lx.add_filter(x, **args)
+            with open(TESTFILE, 'rb') as fp:
                 text = fp.read().decode('utf-8')
-            finally:
-                fp.close()
             tokens = list(lx.get_tokens(text))
+            self.assertTrue(all(isinstance(t[1], text_type)
+                                for t in tokens),
+                            '%s filter did not return Unicode' % x)
             roundtext = ''.join([t[1] for t in tokens])
-            if x not in ('whitespace', 'keywordcase'):
+            if x not in ('whitespace', 'keywordcase', 'gobble'):
                 # these filters change the text
                 self.assertEqual(roundtext, text,
                                  "lexer roundtrip with %s filter failed" % x)
@@ -259,22 +290,16 @@ class FiltersTest(unittest.TestCase):
     def test_whitespace(self):
         lx = lexers.PythonLexer()
         lx.add_filter('whitespace', spaces='%')
-        fp = open(TESTFILE, 'rb')
-        try:
+        with open(TESTFILE, 'rb') as fp:
             text = fp.read().decode('utf-8')
-        finally:
-            fp.close()
         lxtext = ''.join([t[1] for t in list(lx.get_tokens(text))])
         self.assertFalse(' ' in lxtext)
 
     def test_keywordcase(self):
         lx = lexers.PythonLexer()
         lx.add_filter('keywordcase', case='capitalize')
-        fp = open(TESTFILE, 'rb')
-        try:
+        with open(TESTFILE, 'rb') as fp:
             text = fp.read().decode('utf-8')
-        finally:
-            fp.close()
         lxtext = ''.join([t[1] for t in list(lx.get_tokens(text))])
         self.assertTrue('Def' in lxtext and 'Class' in lxtext)