| 2008-09-05 22:08:40 | Ответить |
|---|---|
|
Красильников Алексей Адрес: Сообщений: 26 Регистр: 2008-02-29 его блог 0 сообщ. |
REXML::StreamListener |
|
класс StreamListener библиотеки REXML умеет разбирать XML налету
у него есть функция text(data) ее нужно переопределить и она будет вызываться (callback), когда в xml-файле встречается текст внутри любого тега у меня задача получить этот самый текст и сохранить его в базе в виде utf-8 а у меня какая-то хрень в базу сохраняется... |
|
| REXML, StreamListener |
| 2008-09-05 23:35:23 | Ответить |
|---|---|
|
Красильников Алексей Адрес: Сообщений: 26 Регистр: 2008-02-29 его блог 0 сообщ. |
RE: REXML::StreamListener |
|
кстати, кодировка самого xml windows-1251
|
|
| 2008-09-06 13:39:40 | Ответить |
|---|---|
|
Ruslan Voloshin Адрес: odessa Сообщений: 1293 Регистр: 2007-03-13 его блог 40 сообщ. |
RE: REXML::StreamListener |
|
тогда стоит тебе сначала xml перевести в utf а потом уже пытаться читать его и писать в базу
------------
Занимаюсь вебом и продвижением сайтов.
|
|
| 2008-09-06 15:52:35 | Ответить |
|---|---|
|
Красильников Алексей Адрес: Сообщений: 26 Регистр: 2008-02-29 его блог 0 сообщ. |
RE: REXML::StreamListener |
|
в предыдущем варианте в базу вместо нужного текста клалось что-то типа "/n "
я сделал, как ты сказал поменял в заголовке и сохранил из блокнота в UTF8 теперь StreamListener вообще работать перестал... то есть он вроде и не ругается, но callback-и перестал вызывать при разборе xml мистика... фишка еще в том, что файл 260 метров весит и в руби его другими способами врядли обработать можно |
|
| 2008-09-09 00:29:37 | Ответить |
|---|---|
|
Красильников Алексей Адрес: Сообщений: 26 Регистр: 2008-02-29 его блог 0 сообщ. |
RE: REXML::StreamListener |
|
хорошо, давайте поставим вопрос так:
кто-нибудь знает в каком формате предоставляет данные функция text того самого класса REXML::StreamListener ? или хоть какие-нить намеки, как понять что это за формат, чтобы его потом обработать и в базу уже в нужном (utf-8) виде положить я пробовал вместо базы писать просто в текстовый файл. при этом все отлично читается по-русски и блокнотом и вордом. кстати, ворд предлагает этот файл открыть в utf-8. и firefox его отображает нормально если кодировку utf-8 поставить... а если те же самые данные класть в базу, туда сохраняются строки "/n ". то есть если потом эти данные из базы считать и вывести на страницу, то отобразится именно эта хрень. в общем вопросик такой: какие есть способы оценить что за формат имеет какая-то конкретная переменная с предположительно данными текстовой строки |
|