Единый форум поддержки

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Единый форум поддержки » Форум для новичков » Парсинг сообщений с форума


Парсинг сообщений с форума

Сообщений 1 страница 3 из 3

1

Добрый день. Две темы, которые предложил подбор, видела, однако в связи с кривыми лапками не могу разобраться в них нормально.
Есть форум (ролевая) со стандартным оформлением постов (жирная речь, курсивные мысли), есть нейросетка, которую хочется обучить имитировать диалоги персонажей. Надо как-то стянуть полностью все сообщения каждого игрока, разбив их так, чтобы для каждого тега (NIC) сохранялись отдельные реплики, выделенные тегом (b) в тексте, но не (u)(b), т.е. тег должен стоять один.
В коде страницы этот тег интерпретируется как (strong), однако парсер после прохода по страницам начинает игнорировать две трети strong-ов, в итоге нереально выгрузить нормально прямую речь.
Предполагаю, что при сохранении резервной копии форума сохранение идет как базы данных, однако доступа к sql нет, т.к. не главадмин. Подскажите, можно ли как-то выгрузить копию сайта или спарсить сообщения без залезания в глубины всякого?
(за тык носом в соответствующую тему или в короткую инструкцию, как это сделать через спайдер, буду безумно благодарна!)

+1

2

Лекс Даэ
Можу спарсить платно после 16.06 , обращайтесь в личку Ссылка

+2

3

Лекс Даэ написал(а):

Добрый день. Две темы, которые предложил подбор, видела, однако в связи с кривыми лапками не могу разобраться в них нормально.
Есть форум (ролевая) со стандартным оформлением постов (жирная речь, курсивные мысли), есть нейросетка, которую хочется обучить имитировать диалоги персонажей. Надо как-то стянуть полностью все сообщения каждого игрока, разбив их так, чтобы для каждого тега (NIC) сохранялись отдельные реплики, выделенные тегом (b) в тексте, но не (u)(b), т.е. тег должен стоять один.
В коде страницы этот тег интерпретируется как (strong), однако парсер после прохода по страницам начинает игнорировать две трети strong-ов, в итоге нереально выгрузить нормально прямую речь.
Предполагаю, что при сохранении резервной копии форума сохранение идет как базы данных, однако доступа к sql нет, т.к. не главадмин. Подскажите, можно ли как-то выгрузить копию сайта или спарсить сообщения без залезания в глубины всякого?
(за тык носом в соответствующую тему или в короткую инструкцию, как это сделать через спайдер, буду безумно благодарна!)

Привет,извините,что вмешиваюсь,а можно ли будет у Вас купить/попросить/обменять ,Вашу разработку с нейросетью и имитацией прямой речи и для нашего форума,пожалуйста,как все будет готово?

0


Вы здесь » Единый форум поддержки » Форум для новичков » Парсинг сообщений с форума