Дискуссионный Петрофизический Форум - Petrophysics Forum PETROPHYSICS & INTERPRETATIONS FORUM
форум по петрофизике



Ближайшие конференции (условия участия и обзор) в разделе [РАЗНОЕ]

Полезные ссылки размещены внизу

Все посетители приглашаются к участию в обсуждениях (в форме вопросов, предложений, реплик и полемических замечаний)

 
On-line: гостей 0. Всего: 0 [подробнее..]
петрофизик




Зарегистрирован: 11.07.05
Рейтинг: 3
ссылка на сообщение  Отправлено: 08.08.07 04:06. Заголовок: Berliner Zeitung//С Википедией к диплому


С Википедией к диплому
Ральф Нестлер

Не только при подготовке домашних заданий, но и при написании докторских есть место плагиату. Новое программное обеспечение из Веймара призвано выходить на след воров текстов

Выделить, скопировать, добавить. Выглядит заманчиво: скачать из интернета готовый текст и вставить его в свой документ, выдав все это затем за собственный труд. В ходе одного исследования, проведенного в Университете Лейпцига, 23% студентов признались, что занимаются плагиатом при подготовке домашних заданий – то есть не указывают в конце работы источник. Даже при написании докторских диссертаций случается нечто подобное. Новая компьютерная программа, которая в настоящее время разрабатывается в Университете Баухаус (Веймар), должна будет в будущем помочь раскрыть кражу чужих мыслей.

"Вот уже около 10 лет существуют компьютерные программы, которые дают указания на то, скопировал ли автор текст из другого источника", – говорит преподаватель информатики Мартин Поттхаст из Университета Баухаус. Он и его коллеги с кафедры "Управления сайтами и интернет-технологий" усовершенствовали известные механизмы обнаружения плагиата и объединили в программу под названием Picapica. Эта программа способна отлавливать даже тех, кто переставляет предложения местами, говорит Поттхаст.

Как и в других программах по обнаружению плагиата текст сначала передается в цифровом формате в систему. Для того чтобы отыскать возможные источники в сети, программа выделяет самые важные слова. "В тексте об автомобильных двигателях чаще всего встречаются такие понятия, как автомобиль, двигатель, бензин, дизель и мощность", – поясняет Поттхаст. Чтобы лучше узнавать ключевые слова, программа сначала стирает так называемые слова-тормозы: определенные артикли, местоимения "тот", "этот", а также предлоги "и", "или". Из оставшихся слов десять самых часто встречающихся передаются таким поисковым машинам, как Google или Yahoo. Найденные таким образом документы автоматически оцениваются компьютерной программой, в результате чего выделяются похожие формулировки в тексте.

Иногда те, кто ворует чужие тексты, переставляют местами предложения в надежде на то, что в таком случае воровство идей обнаружить не удастся. Picapica способна раскрыть даже эту хитрость, говорит Поттхас. Это стало возможным при помощи так называемого хеширования. Программисты называют так прием, применяемый для нахождения определенной учетной записи в компьютерном файле.

Программа, разработанная веймарскими специалистами, разделяет любой текст на отрезки, в каждом из которых содержится около 100 слов. Эти отрезки автоматически проверяются при помощи 30 различных статистических методов. Так, например, просчитывается, с какой периодичностью повторяются определенные начальные буквы. В конце все статистические данные суммируются. Полученный результат достаточно точно характеризует весь текст. А поскольку статистические методы не учитывают места слов в предложении, то перестановка предложений лишь в незначительной степени может сказаться на результатах такой проверки.

Программа проверяет, имеются ли в интернет-энциклопедии Википедия отрезки, которые имеют одинаковые хеш-функции. Для этого веймарские ученые в прошлом году проанализировали все немецко- и англоязычные статьи энциклопедии одним и тем же методом и сохранили полученные результаты. Благодаря этому проверка текста сегодня занимает всего несколько секунд.

На самом деле статьи в Википедии меняются, поскольку эта интернет-энциклопедия постоянно расширяется. Но при этом статистические методы остаются весьма надежными. Небольшие изменения не коснутся хеша, говорят программисты. "Но для абсолютной уверенности нужно постоянно обновлять анализ статей".

Как и другие программы по поиску плагиата, Picapica может сравнивать исходный текст только с материалом, выложенным в сети. "Но именно такие материалы используются для плагиата чаще всего", – утверждает социолог Нильс Тауберт из Университета Билефельда. Чтобы быстрее вывести на чистую воду использующих нечестные методы студентов, он использует американскую программу Turnitin, лицензию на которую приобрел университет. "Одно лишь уведомление о том, что мы используем такую систему, на многих действует как устрашение", – говорит Тауберт. Пока программа не была введена в оборот, каждый четвертый пытался выдать списанное за собственную работу. Сегодня таких недобросовестных студентов осталось менее 5%.

Возможно, остаются и другие лжецы, на след которых не может напасть ни Turnitin, ни сам преподаватель – поскольку у него просто нет времени отслеживать все подозрительные моменты. Снизит ли их процент Picapica, станет ясно в будущем году. А до тех пор Мартин Поттхаст и его коллеги будут и дальше оптимизировать свою программу настолько, чтобы она была доступна на веб-сайте их университета и любой заинтересовавшийся смог бы ее протестировать.

Даже для тех, кто из страха быть пойманным программой будет использовать не цифровые источники, а списывать с книг, настанут тяжелые времена. Ведь Picapica способна анализировать и стиль. Например, она сравнивает длину предложений или среднее число слогов в словах. Эти данные становятся признаком того, насколько сложен текст – а здесь бывают отличия в зависимости от темы и автора.
Если показатели внутри исследуемого текста сильно отличаются, то это является прямым указанием на то, что данный автор не все написал самостоятельно.
http://inopressa.ru/berlinonline/2007/08/07/17:05:21/vikipedia

Спасибо: 0 
Профиль Цитата Ответить


Ответ:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Имя, пароль:      зарегистрироваться    
Тему читают:
(-) сообщения внутри нет
(+) новый ответ
(!) объявление администратора
(x) закрытая тема
Все даты в формате GMT  -3 час. Хитов сегодня: 12
Права: смайлы да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация откл, правка нет




(STYLE) .font1 {COLOR: #000000; FONT-FAMILY: Verdana, Arial, Helvetica, sans-serif; FONT-SIZE: 14px} .font2 {COLOR: #000000; FONT-FAMILY: Verdana, Arial, Helvetica, sans-serif; FONT-SIZE: 12px} .font3 {COLOR: #000000; FONT-FAMILY: Verdana, Arial, Helvetica, sans-serif; FONT-SIZE: 14px;} .font4 {COLOR: #FFA450; FONT-FAMILY: Verdana, Arial, Helvetica, sans-serif; FONT-SIZE: 14px; font-weight: 700;} .font5 {COLOR: #ffa450; FONT-FAMILY: Verdana, Arial, Helvetica, sans-serif; FONT-SIZE: 14px
Мои сайты
[Хрестоматия по петрофизике и интерпретации][Петрофизика и интерпретация][Группа ПАНГЕИ] [Cайт памяти Вендельштейна] [Коммуникация и семиотика]

Некоторые профессиональные ссылки (включаю по обмену ссылками)
[Мнемоники собранные в SPWLA] [Общество каротажников - SPWLA] [ЦГЭ (на сайте много публикаций)] [ПАНГЕЯ (на сайте есть публикации)] [Геологический словарь (МГУ)] [Schlumberger] [LandMark] [GeoGraphix] [StatMin (Fugro-Jason)] [PGS Abstracts] [ФОРУМ студентов РГУНГ] [Тектоника плит, вулканизм, самоорганизация] [Адрес осчастливателя нейронными сетями (всех оптом)] [Geofyzika Torun (Poland)]

Полезности и ПОИСК
[Cловари, Переводчики, Почтовый декодер, Отправка SMS, сложный поиск] [Поиск на сайте Хрестоматии по петрофизике ] [Поиск по геолог. ресурсам (МГУ)] [Яндекс][GOOGLE] [Geodictionary (регистрация свободна)] [Поиск по большим русскоязычным библиотекам]

Форумы на которые люблю заходить
[Либеральный Клуб] [Дискуссии со знакомыми о политике] [Я СВОБОДЕН!] [Форум RESEACHER] [Хороший русскоязычный Форум в Казахстане]

Новостные и журнальные сайты на которые люблю заходить
[ГРАНИ] [CВОБОДА] [ИНОПРЕССА] [Новое Время] [ПОЛИТ.ру] [RTV International] [ИНТЕЛЛИГЕНТ] [Московские Новости] [Cтоличные новости] [Новая Газета] [Имеешь право] [Еженедельный Журнал] [Эхо Москвы] [computerra] [Tema дня] [Политический журнал] [Куратор] [ВладимирВладимирович]

Сайты политических партий, движений и организаций на которые заглядываю
[Партия Свободы] [Cвободная Россия (Хакамада)] [СПС] [ЯБЛОКО] [РАДИКАЛЫ] [Дем. союз] [ОБОРОНА] [ДА] [Либеральная миссия] [Институт прав человека] [Московский общественный научный фонд] [Мемориал] [Журнал "Индекс/Досье на цензуру" ] [Центр по проблемам коррупции] [Фонд Аденауэра] [Либеральный Сахалин] [Похмелкин] [Институт развития свободы информации]

Сетевые библиотеки
[Либертариум] [Библиотека Мошкова] [Аудиториум] [Открытая русская электронная библиотека (Орел)] [Библиотека Якова Кротова] [Vivos Voco] [Архив В.Буковского] [Портал по синергетике] [Проблемы эконофизики и эволюционной экономики ] [Форум социнтегрум] [Социальная история отечественной науки] [Элементы: Популярный сайт о фундаментальной науке] [Известия НАУКА]

Частные сайты - cофт
[КП НЕМО] [NNM] [КАДЕТ]

Частные сайты и тексты которые смотрю
[Сайт деятельных скептиков] [DoctoR] [RR-полит] [Соционавтика] [Универсумс] [РЖ Андрей Левкин ] [Синергетика - сайт Курдюмова] [Российская наука в Интернет] [Наука в ПОЛИТ.ру]

Cправочная информация общего характера
[Москва Желтые страницы путешественника] [Москва Большая телефонная книга] [Конвертация единиц измерения] [Законодательство в HTML] [Cловари на сайте РГГУ]