Так называется большой массив специально подобранных текстов в специальной оболочке, которая позволяет осуществлять "умный" поиск по этим текстам. Разработка таких корпусов является дорогостоящим делом и позволить себе это могут только крупные лингвистические центры. В России таким центром является компания
, которая предоставила проекту Economicus свою оболочку и первичный набор экономических текстов. За годы работы этот массив экономических текстов подрос и продолжает расти — лексикографы регулярно складывают в него новые качественные тексты по экономике и смежным дисциплинам.
2. Поисковые системы в интернет. В последние 3-4 года у лексикографов всего мира появился инструмент, который составляет серьезную конкуренцию специально созданным корпусам текстов. Это поисковые системы типа
Google или
Яндекс, которые позволяют в доли секунды получить ссылки на все страницы интернет с интересующим выражением. Объем текстов в интернет в последние годы превосходит любой специальный корпус и имеет определенные преимущества перед корпусами, хотя и не может их полностью заменить. В интернет гораздо больше шансов найти редкое выражение или убедиться в том, что оно несуществует. Но в интернет очень много текстов, написанных малограмотными людьми, и во многих случаях поиск через Google или Яндекс дает ненадежные результаты и выручает только поиск в "благородных" источниках.
3. Электронные архивы. Отличной альтернативой корпусу текстов может быть электронный архив респектабельной газеты или научного журнала. Например,
JSTOR — электронных архив нескольких сотен научных журналов, среди которых половина связана с экономикой и общественными науками. Этот архив имеет возможность полнотекстового поиска по всем журналам и позволяет за секунды найти страницу с редким термином или выражением. Например, когда возник
вопрос о происхождении термина "социум" и его английском эквиваленте, поиск в JSTOR позволил легко убедиться, что слова socium в англоязычной научной литературе не используется, и скорее всего, слово было придумано в России.