Корпусная лингвистика вошла в современную научную парадигму относительно недавно, но совершила в ней революционный переворот. «В узком смысле – это всего лишь наука о том, как создавать корпуса и как ими пользоваться, но она претендует на гораздо большее, на роль новой идеологии науки о языке» [5]. Появление лингвистических корпусов привело к созданию основанной на их использовании технологии – так называемого Data Driven Learning, т. е. обучения с применением баз данных. Эта технология привлекает внимание все большего числа преподавателей иностранных языков разных стран [2; 9; 10; 11], поскольку она «открывает большие возможности, фокусируя внимание на отдельной личности, ее талантах, а также и ее проблемах» [5; 10]. Таким образом, тема цифровизации образования и обучения с применением баз данных становится все более популярной.
Материалы и методы
Задачами данного исследования явились сбор материала, разметка текстов, классификация ошибок, создание таблиц и диаграмм, иллюстрирующих частотность конкретных грамматических, орфографических, пунктуационных и лексических ошибок, а методом – сопоставительный анализ выявленных ошибок и попытка их объяснения.
В последнее время во многих странах ведутся работы по созданию специальных учебных, или ученических, корпусов, в которых фиксируются тексты, написанные школьниками или студентами, изучающими иностранный язык. В Петрозаводском государственном университете сегодня активно развивается корпус ученических текстов ПАКТ (Петрозаводский аннотированный корпус текстов), содержащий разделы на немецком и французском языках.
Первым шагом создания корпуса стал сбор электронных текстов для формирования базы данных письменного языка обучающихся. Студенты принимают активное участие в наполнении корпуса: бо́льшая часть текстов загружена самими авторами. Ряд студентов участвуют и в дальнейшей обработке массива текстов, одновременно собирая материал для своих научных исследований.
Вторым шагом является разметка, или аннотирование текстов, которое осуществляется при сотрудничестве с IT-специалистами. Этот процесс и связанные с ним проблемы уже получили освещение в ряде статей [1; 3; 4; 8]. Частеречная разметка корпуса ПАКТ выполняется автоматически на этапе загрузки текста в базу данных. Затем в загруженных студенческих текстах с помощью специально созданного для этих целей классификатора выявляются и систематизируются допущенные ошибки. Это аннотирование ошибок осуществляется вручную. В классификацию входят 90 элементов, в соответствии с которыми фиксируются определенные типы ошибок: грамматические, лексические, дискурсивные, орфографические и пунктуационные. Данная разметка дает возможность преподавателям анализировать допущенные студентами ошибки и затем составлять тесты и упражнения для всей группы и для отдельных студентов, направленные на отработку того или иного навыка использования языка. Благодаря такой классификации студенты могут самостоятельно анализировать свои ошибки и, включив рефлексию, углубленно работать над материалом, еще недостаточно освоенным.
По состоянию на июнь 2022 г. в корпусе ПАКТ аннотированы немецкоязычные тексты объемом около 300 тыс. токенов.
Следующим этапом явилось генерирование таблиц, графиков и диаграмм ошибок разного характера, допущенных студентами в проанализированных текстах. Полученные результаты позволяют провести анализ типичных ошибок русскоязычных студентов в созданных ими текстах на немецком языке.
Результаты исследования
С помощью статистики ошибок в текстах одного конкретного обучающегося можно проследить индивидуальную траекторию усвоения немецкого языка каждым студентом, что дает возможность указать ему на типичные для него ошибки с тем, чтобы самостоятельно поработать над определенным грамматическим материалом или той или иной лексической темой. На рисунке 1 представлена диаграмма, визуализирующая количество ошибок в письменных работах одной из студенток, изучающей немецкий как основной язык второй год.
Рис. 1. Ошибки в работах студентки
Fig. 1. Mistakes in a female student’s worksheets
Так, студенту, диаграмма ошибок которого представлена на рис. 1, может быть рекомендовано обратить внимание на повторяющиеся ошибки в правописании имен существительных и в пунктуации, а также даны дополнительные упражнения на использование неопределенного артикля, склонение существительных и прилагательных и на порядок слов в придаточном предложении.
Преподавателей несомненно заинтересует также общая статистика ошибок у студентов по разным годам обучения. Таблицы, графики и диаграммы визуализируют полученный материал, они обеспечивают доступ к сложным комплексам данных и облегчают их анализ.
Диаграмма на рисунке 2 позволяет наглядно увидеть динамику в ошибках, допускаемых студентами с первого по пятый курс (рис. 2). На диаграмме представлены укрупненные группы ошибок, однако при глубоком анализе целесообразно обратиться к подробным таблицам, в которых представлены все 90 разрядов классификации ошибок в корпусе (см. табл.).
Рис. 2. Распределение ошибок в работах студентов с 1-го по 5-й курс, %
Fig. 2. Distribution of errors in the works of students from 1st to 5th year, %
Отрывок из таблицы данных по ошибкам группы 123
(второй год обучения)
Excerpt from the error data table for group 123 (second year)
Тип ошибки | Количество ошибок |
Орфография | 194 |
Выбор лексемы | 173 |
Пунктуация | 129 |
Склонение прилагательных | 125 |
Неопределенный артикль | 113 |
Пропуски | 105 |
Склонение существительных | 89 |
Обратный порядок слов | 80 |
Порядок слов в придаточном предложении | 60 |
Определенный артикль | 53 |
Род существительного | 53 |
Форма множественного числа | 53 |
Спряжение | 50 |
Лишние элементы | 43 |
Инфинитивные конструкции с zu | 42 |
Прямой порядок слов | 41 |
Личные местоимения | 33 |
Претеритум | 29 |
Союзы | 28 |
Притяжательные местоимения | 27 |
Выбор предлога | 27 |
Рамочные конструкции | 20 |
Образование сложных слов | 20 |
Возвратные местоимения | 19 |
Такая статистика позволяет сделать важные выводы, имеющие практическое значение. Даже при беглом просмотре диаграммы видно, что возрастающая динамика по курсам проявляется в ошибках на выбор лексики, на использование лишних элементов (например, случайный повтор слов), логику, пропуски, пунктуацию и стиль. Явное снижение количества ошибок к завершающему курсу наблюдается в образовании форм множественного числа, использовании артиклей, предлогов, склонении существительных и прилагательных, спряжении глаголов, т. е. в грамматических темах.
Приступая к анализу ошибок, следует учитывать тот факт, что в Институте иостранных языков ПетрГУ немецкий язык студенты начинают изучать с нуля на первом курсе. В школе подавляющее большинство изучали английский как первый иностранный язык на протяжении 10 лет и сдавали по этому предмету единый государственный экзамен. С одной стороны, у этих студентов уже имеется богатый опыт в изучении иностранного языка, с другой – у них очень часто включается не только первичная интерференция, но и вторичная, т. е. в нашем случае применение правил, свойственных английскому языку, к аналогичным элементам немецкого языка. Так, например, большое количество орфографических ошибок, наблюдаемых на 1-м курсе, – написание немецких имен существительных не с прописной, а со строчной буквы (рис. 3). Немецкий язык – единственный в мире, в котором все имена существительные пишутся с прописной буквы, следовательно, студентам необходимо постоянно особое внимание обращать на этот факт. Примечательно, что студенты, изучавшие в школе немецкий язык даже в качестве второго, таких ошибок не делают, а к 5-му году обучения у всех студентов количество таких ошибок стремится к нулю.
Рис. 3. Пример ошибки первокурсника на написание имени существительного
Fig. 3. Example of a first-year student's mistake in spelling a noun
Влияние английского языка видно и в написании слов с буквами F и V (for вместо vor), С и К (Music вместо Musik), а также в ошибках на написание буквосочетания sch. Кроме того, рассеянное внимание и дефицит времени могут влиять на орфографию, вызывая огромное количество опечаток, отнюдь не всегда свидетельствующих об отсутствии определенных знаний (рис. 4).
Рис. 4. Примеры орфографических ошибок в текстах первокурсников
Fig. 4. Examples of spelling mistakes in the texts of first-year students
Анализ орфографических ошибок показал также, что в результате первичной интерференции русскоязычные студенты иногда не обращают внимания на смыслоразличительную роль долготы и краткости немецких гласных, в связи с чем страдает правописание слов: не учитывается тот факт, что после краткого гласного согласные удваиваются (offen – Ofen), а долгие гласные могут на письме оформляться различно (Segel, Siegel, siehst, See, sehen).
Нужно помнить и о том, что современные встроенные программы проверки правописания автоматически оформляют тексты, иногда без ведома автора управляя его орфографией, в результате чего появляются ошибки, как, например, замена wird на ward, Musik на Music и т. д.
Из графика видно, что на протяжении всего времени обучения у студентов наблюдается несоблюдение пунктуационных правил: стремясь к экономии времени и усилий, они не ставят точку в конце предложения, пренебрегают запятыми, вопросительными и восклицательными знаками. Очень большое количество пунктуационных ошибок у первокурсников связано с интерференцией с родным русским языком: практически все студенты выделяют выражение zum Beispiel (например) и другие вводные слова с двух сторон запятой по примеру русского языка, хотя в немецком языке запятая после таких слов не ставится.
На грамматическом уровне наблюдаются ошибки разного рода, например, в употреблении артикля. В русском языке артикль не нужен, так как окончания имени существительного указывают на его род, число и падеж, а в немецком эту функцию выполняет артикль – сопроводитель имени существительного. Опущение артикля приводит в немецком к такому же результату, как если бы мы в русском языке использовали существительные без окончания, что вызвало бы у русского удивление. Неправильный выбор определенного или неопределенного артикля может быть вызван либо недостаточной освоенностью правил, либо вторичной интерференцией: правила употребления артикля в немецком и английском могут и не совпадать. Так, например, имя существительное в роли предикатива, обозначающее профессию, в немецком языке должно употребляться без артикля, а в английском – с неопределенным артиклем: Er ist Lehrer. He is a teacher (рис. 5).
Рис. 5. Пример тега ошибки на употребление неопределенного артикля
Fig. 5. Example of an error tag «Indefinite article»
К другим частотным ошибкам на морфологическом уровне можно отнести неверный выбор грамматического рода, который в большинстве случаев следует запоминать наизусть, поскольку в немецком языке он чаще всего не мотивирован. В отличие от русского языка, грамматический род напрямую связан с окончанием имени существительного. Склонение имен существительных, образование форм множественного числа, склонение имен прилагательных также вызывают трудности у русскоязычных студентов (рис. 6).
Рис. 6. Пример грамматических и орфографических ошибок из корпуса
Fig. 6. Example of grammatical and spelling errors from the corpus
На синтаксическом уровне в первую очередь вызывает затруднения поря-док слов в немецком предложении, связанный с наличием в нем рамочной конструкции. В простом повествовательном предложении финитный глагол располагается всегда на втором месте, а отделяемая приставка или инфинитив второго глагола ставится в конце, что особенно на начальной стадии изучения немецкого дается не сразу. Совершенно чуждой и русскому, и английскому языкам является позиция финитного глагола в конце придаточного предложе-ния, что вызывает достаточно много ошибок у русскоговорящих студентов (рис. 7).
Рис. 8. Пример лексической ошибки из корпуса
Fig. 8. Example of a lexical error from the corpus
Овладение иноязычными коллокациями поможет правильно учитывать сочетаемость слов в родном и иностранном языках. «И здесь на помощь преподавателям и обучающимся приходят современные интернет-ресурсы, в первую очередь национальные корпуса, в которых за несколько минут можно найти множество примеров употребления искомого слова в его контекстном окружении» [7, с. 63]. Многие крупные корпуса имеют функцию отображения наиболее частотных коллокаций, и использование этой функции должно войти в широкую практику преподавания иностранного языка с целью развития коллокационной компетентности студентов.
Список литературы
- Барымова Н. С. Франкоязычный корпус студенческих текстов ПАКТ: достижения и перспективы / Н. С. Барымова // Отражения: язык и культура в синхронии и диахронии. Петрозаводск, 2022. С. 120–123.
- Виноградова О. И. Работа с языковыми корпусами в изучении иностранных языков, в обучении им и в их использовании / О. И. Виноградова // Межкультурное пространство: лингвистический и дидактический аспекты. Сборник статей по материалам науч.-практ. онлайн-конференции: в 2 ч. / под ред. Е. В. Борзовой, Е. Н. Воротилиной и др. Петрозаводск, 2021. Ч. 1. С. 20–29.
- Котюрова И. А. Исследование инструментов частеречной разметки для создания корпуса ученических текстов / И. А. Котюрова // Педагогическая информатика. Москва, 2021. № 3. С. 81–89.
- Котюрова И. А. Проблемы создания классификатора ошибок для разметки корпуса учебных текстов на немецком языке / И. А. Котюрова // Межкультурное пространство: лингвистический и дидактический аспекты. Сборник статей по материалам науч.-практ. онлайн-конференции : в 2 ч. / под ред. Е. В. Борзовой, Е. Н. Воротилиной и др. Петрозаводск, 2021. Ч. 2. С. 34–41.
- Dräger J., Müller-Elselt R. Die digitale Bildungsrevolution: Der radikale Wandel des Lernens und wie wir ihn gestalten können. München : Deutsche Verlags Anstalt, 2015. S. 8.
- Плунгян В. А. Почему современная лингвистика должна быть лингвистикой корпусов? Стенограмма лекции [Электронный ресурс]. Электрон. дан. URL: https://polit.ru/article/2009/10/23/corpus/ (дата обращения: 25.07.2022).
- Токко Н. И. Значение коллокаций в изучении и преподавании немецкого языка как иностранного [Электронный ресурс] / Н. И. Токко // Гуманитарные аспекты высшего профессионального образования : электронный сборник статей и тезисов докладов V Международной заочной научно-практической конференции (24 февраля 2022 г.). Макеевка, 2022. С. 61–66. Электрон. дан. URL: http://donnasa.ru/docs/nik/nauchnye_konferencii/sbornik_statey_i_tezisov_dokladov_2022.pdf (дата обращения: 27.07.2022).
- Barymova N. [et al.]. Part-Of-Speech Taggers Features In French Learner Texts [Electronic resource] // Proceedings of the FRUCT 29. 2021. № 2. P. 500–502. Electron. dan. URL: https://fruct.org/publications/acm29/files/zBar.pdf (date of access: 27.07.2022).
- Boulton A. Spreading the net: Empirical studies in data-driven learning [Electronic resource]. Online symposium «Incorporating Corpora in Teaching», Report. Mid-Sweden University. 2020. Electron. dan. URL: https://hal.archives-ouvertes.fr/hal-02977549 (date of access: 27.07.2022).
- Dubova A., Proveja E. Datengeleitetes Lernen im studienbegleitenden Deutschunterricht am Beispiel des KoGlossAnsatzes. Zeitschrift für Interkulturellen Fremdsprachenunterricht 21. 2016 [Electronic resource]. Electron. dan. URL: https://zif.tujournals.ulb.tu-darmstadt.de/article/id/3050/ (date of access: 27.07.2022).
- Lüdeling A. Was ist schwierig? – Eine korpusbasierte Analyse struktureller Lernschwierigkeiten im Deutschen als Fremdsprache [Electronic resource]. Electron. dan. URL: https://gepris.dfg.de/gepris/projekt/105286979/ergebnisse?context=projekt&task=showDetail&id=105286979&selectedSubTab=2& (date of access: 27.07.2022).