Рассчитай точную стоимость своей работы и получи промокод на скидку 200 ₽
Найди эксперта для помощи в учебе
Найти эксперта
+2
выполнено на сервисе Автор24
Студенческая работа на тему:
Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9
Создан заказ №3710939
8 марта 2019

Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9

Как заказчик описал требования к работе:
1. Установка RapidMiner и обновление его до последней версии 9.2 2. Установка компонентов textMining и WebMining 3. Использование оператора CrawlWeb для сохранения документов на рабочий компьютер 4. Использование компонента - Process Dociment from files и различных фильтров 5. Проведение кластеризац ии документов Сделать как можно быстре
подробнее
Фрагмент выполненной работы:
Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Решение: Необходимо провести анализ и кластеризацию данных, web - страниц при помощи программы RapidMiner v9.0. Создаем аккаунт на официальном сайте, скачиваем программу RapidMiner Studio. Выбираем тип лицензии Education. Устанавливаем программу на свой компьютер. После завершения установки. открываем программу и устанавливаем модули Web Mining и Text Processing. (работа была выполнена специалистами author24.ru) В модуле Web Mining выбираем Crawl Web для скачивания web –страниц. В параметрах модуля устанавливаем необходимые настройки: адрес сайта, папку для размещения скачанных страниц, максимальное количество скачанных страниц, максимальный объем страницы. 11049041021000 После нажатия на синий треугольник для запуска процесса, мы видим в результатах, что скачивания страниц не происходит. right000Скачиваем страницы вручную. Темы сайтов для скачивания страниц являются: «Экономика», «Спорт», «Дизайн», «Кино». По каждой из те скачиваем 10 страниц, 1 уровня вложенности. Из Text Processing выбираем модуль Process Documents from files для текстового анализа скачанных страниц. Устанавливаем свойства: кодировку: UTF-8, частотную характеристику TF-IDF, которая и показывает, как часто встречается какое - либо слово в документе, а также в скольких документах встречается это слово. right21272500 Добавляем на панель также модуль Clustering для определения параметров кластеризации. Выход модуля Process Documents from files соединяем со входом модуля Clustering, а выход модуля Clustering соединяем с выходом панели программы. right22606000 Дважды щелкнув по прямоугольнику модуля Process Documents from files устанавливаем необходимые фильтры для анализа и кластеризации данных. -137160000 8.1 Фильтр Extract Information предназначен для извлечения текста из web –страниц, удаляя все теги. Параметры установлены по умолчанию. 8.2 Фильтр Tokenize предназначен извлечения из текста отдельных слов. Параметры установлены по умолчанию. 8.3 Фильтр Tokens by (Length) предназначен для отбора слов по длине. Параметры отбора выставляем длину слов от 4 до 25 символов. 8.4 Фильтр Tokens by (Content) предназначен для отбора только русских или иностранных слов. Для выбора русских слов ставим галочку рядом с командой invert condition и записываем регулярное выражение [a-zA-Z]. 8.6 Фильтр Transform Cases предназначен для отбора слов, написанным в верхнем или нижнем регистре...Посмотреть предложения по расчету стоимости
Зарегистрируйся, чтобы получить больше информации по этой работе
Заказчик
заплатил
200 ₽
Заказчик не использовал рассрочку
Гарантия сервиса
Автор24
20 дней
Заказчик принял работу без использования гарантии
9 марта 2019
Заказ завершен, заказчик получил финальный файл с работой
5
Заказ выполнил
DWork
5
скачать
Необходимо провести анализ и кластеризацию данных web - страниц при помощи программы RapidMiner v9.docx
2019-03-12 22:17
Последний отзыв студента о бирже Автор24
Общая оценка
5
Положительно
Большое спасибо замечательному Автору! Работа была выполнена раньше срока и строго в соответствие с методическими указаниями! Контрольная оценена на "5"! Спасибо вам большое! Автора рекомендую!

Хочешь такую же работу?

Хочешь написать работу самостоятельно?
Используй нейросеть
Мы создали собственный искусственный интеллект,
чтобы помочь тебе с учебой за пару минут 👇
Использовать нейросеть
Тебя также могут заинтересовать
Создание рельефа местности в программе 3d max
Лабораторная работа
Информатика
Стоимость:
300 ₽
ТюмГИК, информатика, в-3 (реферат)
Реферат
Информатика
Стоимость:
300 ₽
Реферат. Операционные системы
Реферат
Информатика
Стоимость:
300 ₽
Лабораторные работы по Prolog(1 рекурсия, 2 файлы)
Лабораторная работа
Информатика
Стоимость:
300 ₽
Проектирование и разработка БД «Автосервис»
Курсовая работа
Информатика
Стоимость:
700 ₽
Автоматизированное рабочее место
Реферат
Информатика
Стоимость:
300 ₽
С помощью программы Фронт Пейдж создать сайт
Контрольная работа
Информатика
Стоимость:
300 ₽
Ответы на вопросы по интеллектуальным системам - Вариант 1
Контрольная работа
Информатика
Стоимость:
300 ₽
Задание по написанию программы в среде Keil μVision
Контрольная работа
Информатика
Стоимость:
300 ₽
Паскаль
Контрольная работа
Информатика
Стоимость:
300 ₽
1ая ргр по информатике
Контрольная работа
Информатика
Стоимость:
300 ₽
Тест по строительной информатике
Контрольная работа
Информатика
Стоимость:
300 ₽
Информационные технологии в экономике (PowerPoint + Excel), вариант 22
Контрольная работа
Информатика
Стоимость:
300 ₽
Исправление ошибок в Контрольной работы по Информатике
Контрольная работа
Информатика
Стоимость:
300 ₽
информатика
Контрольная работа
Информатика
Стоимость:
300 ₽
Читай полезные статьи в нашем
Помехоустойчивые коды
Цифровой сигнал, как и аналоговый, критичен к влиянию помех. Вероятность появления ошибок в канале связи зависит от самого канала. В кабельных системах передач, к примеру, она будет на много меньше, чем в системах цифровой радиосвязи, но не нулевой. Без возможности исправления ошибок качество принимаемого сигнала будет неудовлетворительным. При вероятности появления ошибок и скорости цифровых данн...
подробнее
Кодирование видеоинформации
Кодирование видеоинформации можно охарактеризовать тремя факторами:
Помимо устранения пространственной избыточности, эффективное временное предсказание движения деталей изображения и его компенсация всегда было ключевым фактором, определяющим общий коэффициент сжатия при кодировании видеоинформации. Практически реализованные системы кодирования используют блочную оценку движения и его компенсацию,...
подробнее
Мультимедиапроектор
По функциональному назначению проекторы делятся на 3 основные группы:
Проекторы первой группы обычно ориентированы на воспроизведение динамичного контента, проекторы второй и третьей группы предназначены для динамичного и статичного контента. К отдельной группе можно отнести сверхминиатюрные проекторы весом до 0,5 кг. Широко стали распространены проекторы, которые поддерживают передачу информац...
подробнее
Внеурочная деятельность по информатике
Внеурочная деятельность по школьному предмету "Информатика" (кружки, факультативы, конкурсы, викторины и т.п.) практически не регламентирована государственными органами образования. Ее организация является, как правило, прерогативой педагогического коллектива школы (в первую очередь преподавателя информатики) и межшкольных объединений. Могут быть организованы занятия по:
При развитии этого вида пед...
подробнее
Помехоустойчивые коды
Цифровой сигнал, как и аналоговый, критичен к влиянию помех. Вероятность появления ошибок в канале связи зависит от самого канала. В кабельных системах передач, к примеру, она будет на много меньше, чем в системах цифровой радиосвязи, но не нулевой. Без возможности исправления ошибок качество принимаемого сигнала будет неудовлетворительным. При вероятности появления ошибок и скорости цифровых данн...
подробнее
Кодирование видеоинформации
Кодирование видеоинформации можно охарактеризовать тремя факторами:
Помимо устранения пространственной избыточности, эффективное временное предсказание движения деталей изображения и его компенсация всегда было ключевым фактором, определяющим общий коэффициент сжатия при кодировании видеоинформации. Практически реализованные системы кодирования используют блочную оценку движения и его компенсацию,...
подробнее
Мультимедиапроектор
По функциональному назначению проекторы делятся на 3 основные группы:
Проекторы первой группы обычно ориентированы на воспроизведение динамичного контента, проекторы второй и третьей группы предназначены для динамичного и статичного контента. К отдельной группе можно отнести сверхминиатюрные проекторы весом до 0,5 кг. Широко стали распространены проекторы, которые поддерживают передачу информац...
подробнее
Внеурочная деятельность по информатике
Внеурочная деятельность по школьному предмету "Информатика" (кружки, факультативы, конкурсы, викторины и т.п.) практически не регламентирована государственными органами образования. Ее организация является, как правило, прерогативой педагогического коллектива школы (в первую очередь преподавателя информатики) и межшкольных объединений. Могут быть организованы занятия по:
При развитии этого вида пед...
подробнее
Теперь вам доступен полный отрывок из работы
Также на e-mail вы получите информацию о подробном расчете стоимости аналогичной работы