[{{mminutes}}:{{sseconds}}] X
Пользователь приглашает вас присоединиться к открытой игре игре с друзьями .
Ctrl предыдущая следующая Ctrl Страницы
1 2

Форум «Программное обеспечение» / Новый текстовый парсер

Voronov Сообщение #21 16 июля 2016 в 16:19
Кибергонщик
54
да нет)) речь была не про .NET. Сначала он спросил что такое линукс, затем спросил что такое coreutils и что можно с ними сделать, не поверил что можно решить в шеле практически любую задачу в реалиях обработки текста при помощи них, и стал доказывать что coreutils это пережиток прошлого, совершенно не представляя даже что это, что всем нужно пользоваться готовыми решениями, и если ему что-то нужно другое, выходящее из функций его программы, он будет писать новую программу для себя. Он так рьяно пытался мне доказать что при помощи coreutils не получится вывести определенное количество слов, с заданной длиной строчки, что был несколько раз предупрежден, чтобы не спамил, но он не успокоился. В итоге пришлось заблокировать)
Последний раз отредактировано 16 июля 2016 в 16:20 пользователем Voronov
ДядяСаша Сообщение #22 16 июля 2016 в 16:28
Маньяк
48
Voronov писал(а):
как придирку к его крутой проге

Я все "это" (словари для себя) делаю в Notepad++ там все есть. Ну так, запустил попробовать ради теста этот парсер, вроде работает, на первый взгляд, даже что-то отсортировал с книги, один раз просто вылетел. Особенного то ничего нет в нем. На экзамен по программированию -тянет.
lins Сообщение #23 16 июля 2016 в 16:44
Новичок
1
Voronov писал(а):
спросил что такое coreutils и что можно с ними сделать, не поверил что можно решить в шеле практически любую задачу в реалиях обработки текста при помощи них, и стал доказывать что coreutils это пережиток прошлого... пытался мне доказать что при помощи coreutils не получится вывести определенное количество слов, с заданной длиной строчки...

Ну, тады "Ой!" :)

ЗЫ Разумеется, всё это делается, и возможностей - хоть по цвету подбирай!
Если пишется под .NET с колокольни того, что в нём приходится работать, это дело одно. Но любые другие случаи применения вряд ли обоснованы! :) Проще, быстрее (не многое, а очень многое), делается, конечно, под линуксами... А уж когда дело касается обработки текста, даже и говорить не о чем!
Сама по себе Windows представляет собой систему очень кастрированную, точно такую же, как и макось (в бытность ее безыксовую), только ещё хуже... Частично преодолеть такую беду помогают cygwin и MinGW. Вот тогда она может стоять уже и в качестве основной системы. Особенно для тех, кто пользует программы, аналоги которых под линукс есть, но по каким-то причинам не устраивают. Такое возможно. Но без основных nix'овых утилит жить под виндой просто невозможно.
Дело, впрочем, конечно, хозяйское...
Последний раз отредактировано 16 июля 2016 в 16:59 пользователем lins
sav1 Сообщение #24 17 июля 2016 в 00:20
Маньяк
42
Про линукс поцаны зажгли однако. Миллион домохозяек (и прочих простых смертных) молча кивнули, только непонятно это "да" или "нет". Если оставить за бортом статистики пользователей вин, которыйх у нас пока большинство, то склоняюсь что большая масса оставшихся на убунту, и подавляющая их часть не практикует или не желает возиться в консоли с парсингом.

ТОМА-АТОМНАЯ писал(а):
Скажи, мил друг, у тебя это генератор словоформ что ли? Может расскажешь, что конкретно он делает и с какой целью. Вроде у Котанчика был генератор
позволю себе прокоментировать за автора.

Программа делает тексты из словоформ (уникальных слов) из указанного базового словаря, также как Generator автора iWeelBuy, который использовал Котанчик, который представлен здесь http://klavogonki.ru/forum/general/432/page4/. Тот генератор делает 5000 строк, исходный словарь должен лежать по адресу d:go.txt, выходной получается там же с предопределенным единственным именем go_updated. Можно указать длину строки. И все. И автор уже покинул сайт.

Этот может делать расширенную выборку как сразу описано в первом посте: отбор по маске с использованием стандартных подстановок знаками * и ?, отбор по длине слова, и ряд других опций. Имена файлов и расположение не предопределены и задаются.

И мои предложения/пожелания и прочие имхо:
1. Можно добавить сохранение предыдущих опций (ини-файл или подобие), затем в исходном дистрибутиве установку дефолтных значений для быстрого запуска чтобы при первом запуске нажатием кнопки Запустить уже получить файл (маска, длина, дефолтный словарь zdf-win.txt из каталога запуска, выгрузка туда же с суфиксом, например zdf-win-generated.txt)
2. Предпросмотр в одной строчки размером в несколько знаков маловат.
3. ошибка незаполненных полей должна указывать на поле.
4. кнопку Запустить можно запускать нажатием Enter, если в фокусе нет элемента где этот Enter имеет смысл.
5. пустое поле маски может быть равносильно маске *.
6. подумай над драг-н-дропом (входного словаря), мы стали очень ленивы. очень-очень. Можно добавить чтение копипасты из буфера (ведь сохранять в файл нам тоже лень); иеще туда же выбрасывать результат.
7. для предпросмотра лучше добавить галку, чтобы был доступен не только при отсутствии указания выходного файла (вдруг я передумал, или хочу и выход и смотреть сразу).
Последний раз отредактировано 17 июля 2016 в 00:23 пользователем sav1
lins Сообщение #25 17 июля 2016 в 02:02
Новичок
1
sav1 писал(а):
Про линукс поцаны зажгли однако. Миллион домохозяек (и прочих простых смертных) молча кивнули, только непонятно это "да" или "нет". Если оставить за бортом статистики пользователей вин, которыйх у нас пока большинство, то склоняюсь что большая масса оставшихся на убунту, и подавляющая их часть не практикует или не желает возиться в консоли с парсингом.

Собственно, "миллион домохозяек", вне зависимости от системы, которая у них установлена, по любому "не практикуют" или не желают "возиться в консоли с парсингом". И не только "в консоли", и не только "с парсингом"! :) Мышкой тыкать можно - и ура! - чего ещё надо... Немудрено, у домохозяек - свои заботы!

Но здесь-то, именно попытка что-то распарсить! И вместе с этой попыткой продемонстрировано явное незнание основ работы с текстом. Причём настолько явное, что Voronov аж забанил в своём профиле! :)

Здесь же речь не о том, "что лучше", не о преимуществах той или иной системы, а о том, "работает" или "не работает". Причём, не под Mono какой-нибудь, а под самым, что ни на есть .NET! Версии 4.0. Правда, вполне возможно, что оно работать и не должно. Тут сложно сказать... А информации как бы и нет!
Поскольку
Попробуйте установить последний фреймворк .NET последней версии (4.5 или выше).

совет, конечно, добрый, однако под Windows XP максимальной версией .NET является именно версия 4.0. Не исключено, разумеется, что вопрос как-то решается - ведь большинство решений под виндой иначе, чем какими-то плясами с бубном и не происходит, кто-то парится, время своё гробит, в конце-концов находит решение и выкладывает его в Сеть. Поскольку от Майкрософт добиться чего-либо вразумительного (на любой предмет!) просто нереально. Эдаким "полухаком" всё и решается, именно плясами с бубном! В отличие от иных систем! :) Например, то что патлатый назвал
Придется немного с грабом поплясать.

дык, это не "поплясать" называется, а "почитать". "Плясать" там не надо, всё написано (а кое-где ещё и даже русским языком) - man grub, man grub2, ежели чего подзабыл, и всего делов!

А тут - да... Придётся кому-нибудь и "поплясать", особенность системы, чего уж поделать! Хотя дело здесь даже не в этой "особенности", обусловленной, прежде всего, выраженной баблонаправленностью, а в том, что сама система рассматривает юзера как барана, предназначенного лишь для стрижки этого самого бабла. И именно такого юзера она и формирует. В отличие от других систем, где личность пользователя исходно предполагается некой мыслящей сущностью, которая в состоянии что-либо сделать самостоятельно, решая свои проблемы. А на остальное - хладнокровно положить с прибором...

Разумеется, и под Windows можно остаться (и быть) человеком, не исключено даже, что можно и воспитать нормального пользователя из откровенной домохозяйки, однако, для этого требуются уже куда большие усилия. По любому, путь куда менее эффективный...

Хотя, опять малость не туда...
Короче, дело не в системах, а в предельно простом вопросе: ОНО РАБОТАЕТ ИЛИ НЕТ? И покамест, похоже, что НЕТ.
Последний раз отредактировано 17 июля 2016 в 02:10 пользователем lins
Voronov Сообщение #26 17 июля 2016 в 08:19
Кибергонщик
54
Про линукс поцаны зажгли однако. Миллион домохозяек (и прочих простых смертных) молча кивнули, только непонятно это "да" или "нет". Если оставить за бортом статистики пользователей вин, которыйх у нас пока большинство, то склоняюсь что большая масса оставшихся на убунту, и подавляющая их часть не практикует или не желает возиться в консоли с парсингом.

Я не уверен что это можно парсингом назвать даже)
Почти весь функционал, описанный в первом сообщение темы, это элементарные выражения с регулярками, с которыми справится один grep. Лично мое мнение, если уже хотелось "продвинуть" в народ подобного рода программы, то нужно было писать на хотя бы на питоне для кроссплатформенности и прозрачности для пользователя. Запустил - работает. Те кто используют unix-based системы получили бы функционал из коробки, для win можно было обойтись Py2Exe или PyInstaller.
Не нужно было никаких .NET для работы. А домохозяйки они и где угодно домохозяйки, для большинства таких пользователей беда даже инсталлятор будет скачать того же .NET если он не встроенный в ОС, не говоря про то что поставить. Ну каждый делает по мере своих сил и знаний.
Речь то была не о том, я автору ничего вообще не предъявлял) и мой пост про linux относился к попыткам запуска под XP в виртуалке). А автор немного повеселил не зрелостью своих суждений. И даже дело не в том что он просто не слышал слова Linux, он стал спорить и опровергать то, о чем только что услышал, понятия не имея что да как :) А это скорее всего реакция совсем молодого человека и даже попытки ему объяснить, чувак, успокойся, никто к твоей проге не придирается, еще больше сильнее раззадорили его).

скрытый текст…


скрытый текст…
Последний раз отредактировано 17 июля 2016 в 13:35 пользователем Voronov
ТОМА-АТОМНАЯ Сообщение #27 17 июля 2016 в 10:06
Организатор событий
116
Слава новому генератору - рабочему. Теперь словари определенной длины и с определнными сочетаниями составить спецам не проблема. Только Война и Мир, судя по скрину Линса, пока не поддается генерированию
Radmir2015 Сообщение #28 17 июля 2016 в 11:05
Супермен
26
Voronov, Где я придираюсь? Я просто хотел узнать побольше про эти утилиты от тебя, потому что сейчас установить линукс и разбираться в нем, не имею ни возможности, ни желания.
Radmir2015 Сообщение #29 17 июля 2016 в 11:08
Супермен
26
ТОМА-АТОМНАЯ, все поддается, просто наш дорогой друг использует устарелое ПО, на котором стандартно нет той базы, под которой работает программа. На Windows 7 и выше полет должен быть нормальным.
Последний раз отредактировано 17 июля 2016 в 11:09 пользователем Radmir2015
lins Сообщение #30 17 июля 2016 в 15:10
Новичок
1
просто наш дорогой друг использует устарелое ПО

Угу. Что же касается нашего "дорогого друга", то он, помимо того, что не имеет представления о работе с текстом, ещё и не в состоянии даже исходно определить где будет работать его программа. Пользователи, с его колокольни, должны бы знать это лучше. Ну, пользователи-то, конечно, знают, на то они и пользователи... Разберутся, на край.

Что касается "устарелого ПО", судить это всё же лучше тем, кто понимает то, что он вообще делает. И для чего! Зачастую люди пишут под .NET, но делают это с расчётом, чтобы продукт их действа работал как на большинстве машин под управлением Windows, так и под средами, эмулирующими .NET. Таких уже существует не менее двух (может и больше, не интересовался - "моно нам не нуно!", но кому-то, может, и "нуно"!). Но это уже сложно, конечно...

И уж во всяком случае, сходу выкладывать на всеобщее обозрение свои финансовые реквизиты с намерением ещё и получить каких-то денег за свой откровенно неотттестированный опус, вряд ли стоило!
lins Сообщение #31 19 июля 2016 в 19:52
Новичок
1
Чего, смотрю тема ушла, бобик сдох окончательно? :)

Ну, что ж, это бывает...
В конце-концов, ещё древние греки говорили (аж на древнегреческом языке), что для того, чтобы было много компота и много девчонок, нужно постоянно учиться и постоянно пахать! Разумеется, мудрость сия не для всех...
Тем же, кто "не для всех", придётся всю жизнь довольствоваться водой из под крана и тайком кидать странные взгляды на ничего не подозревающую корову, гуляющую в соседнем дворе.

Так и вот! Может, кто-нибудь из писавших/читавших/запускавших программы под платформу .NET подскажет в чём там дело? Не исключено же, что когда-нибудь таки придётся запускать некую .NET-программу и столкнуться с такой же фигнёй!

Что за ошибку выдаёт Windows XP, есть на предыдущей странице, а под Linux (Debian jessie, Wine/Mono) она выглядит так:

скрытый текст…


Выдаётся туева хуча ошибок. Правда, надо заметить, что в случае запуска под Windows эти ошибки выглядят как-то очень шестнадцатирично, а Wine/Mono выдаёт что-то более вменяемое... Но эффект - тот же!
То есть, основная программа, как и в первом случае - запускается, а утилита для неё - хрен! Так и вопрос - версия .NET или же что-то ещё?
pashkhan Сообщение #32 26 сентября 2019 в 02:22
Новичок
96
хороший парсер, работает быстро и просто, качайте - пока ссылка жива. С помощью него создал словарик - ЭХ - Light буквально за 5 минут!
pashkhan Сообщение #33 20 ноября 2019 в 02:40
Новичок
96
Программулька очень классная, но интерфейс немного не интуитивный. Вот сейчас решил создать новый словарик, открыл программу, а так сходу запустить генератор не получилось, пришлось по новой разбираться (забыл все напрочь).

Расскажу, что нужно делать на примере свежесозданного словарика Цифры СИГНАЛЫ

1. в папке с программой, нужно создать текстовый файлик в блокноте. С любым названием и нужным вам содержанием. В моем случае там было не густо:

скрытый текст…


2. А потом запустить сам генератор, окошки нужно было заполнить следующим образом:



Самое главное поставить звездочку ( * ), чтобы в ход пошли все слова из вашего файла. Указать длину ваших слов (можно промежутком, но это не в моем случае). Размер каждого текста, я решил что "соточки" мне будет маловато и надо попробовать найти "новый идеальный" размер - будем пробовать 150. Кол-во строк (текстов) - это сколько уникальных текстов будет в итоге в нашем словаре, 5000 должно хватить :) Все остальное пропускаем, в данном случае мне оно не надо, а вот галочку для разделения получившихся текстов пустой строкой - обязательно ставим (при загрузке в словарь на КГ, это необходимо для формата "тексты"). Выбираем наш файлик, о котором речь шла выше. И обязательно, нажимаем "Сохранить файл" - и там уже задаем название и создаем новый файлик, куда и запишется все что сгенерируется в конечном итоге. И только после всего этого, нажимаем "Создать". Далее заходим в наш сохраненный файлик (который мы задавали, нажав "Сохранить файл" ) - и получаем желаемый результат (жмем правой кнопкой мыши и выбираем "выделить все", копируем это дело и можно вставлять в новосозданный словарь на КГ).
pashkhan Сообщение #34 17 марта 2021 в 20:10
Новичок
96
Ура, ребята! Я победил этот парсер))) Никак не хотел он работать, все выбираю - вроде все правильно, а он нифига не генерит, чего я только не перепробовал, как только не тестировал - а он не видит мой загруженный текст и все тут. И наконец, на меня снизошло озарение - данный парсер не работает с кодировкой UTF-8, ему видите ли только ANSI подходит. Короче, вот что надо делать: сохранили текстовый файлик, со своим текстом из экселя (к примеру), но он в утф-8! Тогда скачиваем такую штуку: https://notepad-plus-plus.org/ ( notepad++ ) - самой последней версии, там выбирайте 32 битовый или 64 (мне пожирней, заверните). Качаем инсталлер и устанавливаем. Открываем этот блокнотик, через него открываем наш файлик - и жмем "кодировки" - "преобразовать в ANSI" и сохраняем. Теперь данный парсер наконец узрит что за текст вы ему скармливаете и поймет что надо с ним делать!

Чтобы писать в форуме, нужно зарегистрироваться.

Ctrl предыдущая следующая Ctrl Страницы
1 2

Связаться
Выделить
Выделите фрагменты страницы, относящиеся к вашему сообщению
Скрыть сведения
Скрыть всю личную информацию
Отмена