Добрый день. Две темы, которые предложил подбор, видела, однако в связи с кривыми лапками не могу разобраться в них нормально.
Есть форум (ролевая) со стандартным оформлением постов (жирная речь, курсивные мысли), есть нейросетка, которую хочется обучить имитировать диалоги персонажей. Надо как-то стянуть полностью все сообщения каждого игрока, разбив их так, чтобы для каждого тега (NIC) сохранялись отдельные реплики, выделенные тегом (b) в тексте, но не (u)(b), т.е. тег должен стоять один.
В коде страницы этот тег интерпретируется как (strong), однако парсер после прохода по страницам начинает игнорировать две трети strong-ов, в итоге нереально выгрузить нормально прямую речь.
Предполагаю, что при сохранении резервной копии форума сохранение идет как базы данных, однако доступа к sql нет, т.к. не главадмин. Подскажите, можно ли как-то выгрузить копию сайта или спарсить сообщения без залезания в глубины всякого?
(за тык носом в соответствующую тему или в короткую инструкцию, как это сделать через спайдер, буду безумно благодарна!)
Парсинг сообщений с форума
Сообщений 1 страница 3 из 3
Поделиться1Пт, 5 Июн 2020 14:33:53
Поделиться2Пт, 5 Июн 2020 15:24:13
Лекс Даэ
Можу спарсить платно после 16.06 , обращайтесь в личку Ссылка
Поделиться3Пн, 8 Июн 2020 17:16:59
Добрый день. Две темы, которые предложил подбор, видела, однако в связи с кривыми лапками не могу разобраться в них нормально.
Есть форум (ролевая) со стандартным оформлением постов (жирная речь, курсивные мысли), есть нейросетка, которую хочется обучить имитировать диалоги персонажей. Надо как-то стянуть полностью все сообщения каждого игрока, разбив их так, чтобы для каждого тега (NIC) сохранялись отдельные реплики, выделенные тегом (b) в тексте, но не (u)(b), т.е. тег должен стоять один.
В коде страницы этот тег интерпретируется как (strong), однако парсер после прохода по страницам начинает игнорировать две трети strong-ов, в итоге нереально выгрузить нормально прямую речь.
Предполагаю, что при сохранении резервной копии форума сохранение идет как базы данных, однако доступа к sql нет, т.к. не главадмин. Подскажите, можно ли как-то выгрузить копию сайта или спарсить сообщения без залезания в глубины всякого?
(за тык носом в соответствующую тему или в короткую инструкцию, как это сделать через спайдер, буду безумно благодарна!)
Привет,извините,что вмешиваюсь,а можно ли будет у Вас купить/попросить/обменять ,Вашу разработку с нейросетью и имитацией прямой речи и для нашего форума,пожалуйста,как все будет готово?