Практически весь интернет становится русскоязычным, применение переводчика в программе СайтСпутник

Jan 29, 2019 16:18


Дата выхода публикации - 29.01.2019г.    Суть новой функции программы
Одним предложением о том, что написано в заголовке:
  • сформированное Пользователем задание (проект) на русском языке,
  • автоматически переводится на группу иностранных языков и выполняется,
  • полученные результаты автоматически переводятся "обратно" на русский язык.

Другими словами, практически весь интернет Пользователь видит на русском языке.

Подробнее, в двух предложениях:
    1) используя SiteSputnik Pro (самую простую комплектацию программы SiteSputnik), можно:
  • составить несколько запросов на русском языке к нескольким источникам информации,
  • автоматически перевести каждый из них на несколько языков, выбранных Вами,
  • при желании ознакомиться и подправить машинный перевод руками,
  • выполнить поиск и сбор информации на всех выбранных языках,
  • получить объединеный результат, переведенный "обратно" на русский язык.

    2) Используя SiteSputnik Pro+News или более продвинутую комплектацию программы, можно выполнить мониторинг и анализ информации, а именно:
  • найденные ссылки автоматически скачать и перевести с исходного языка на русский язык,
  • определить на русском языке дополнительные критерии, которым должны удовлетворять ссылки,
  • по каждому критерию получить полнотекстовые русскоязычные ленты из содержания ссылок.

  • Дополнительный сведения:
  • для перевода на иностранные языки и "обратно" применяется Переводчик Google,
  • разработано по заявке Дмитрия Борисовича "MOS",
  • доступно в программе Site Sputnik, начиная с версии 9.6.6 от 29.01.2019,
  • при разработке данной функции использовались методы естественного интеллекта.


Каким способом это достигается 1. Допустим, что нужно собрать информацию: на заданную тему:
  1. по четырем запросам:
    • Новости нефтегазового сектора в мире
    • мировой рынок нефти и газа
    • сжиженный углеводородный газ анализ и прогнозирование
    • перспективы сланцевой нефти и газа
  2. на 12 языках: • Русский язык • Испанский • Норвежский • Азербайджанский   • Итальянский   • Турецкий • Английский • Китайский • Французский • Арабский • Немецкий • Японский
  3. используя 4 источника информации: • Google
    • Yahoo
    • Yandex
    • Google.Новости
2. Открываем новый Проект в программе СайтСпутник и формируем задание:
  1. Выбираем нужные языки:


      Как обратиться к этой картинке показано ниже в разделе "Детали работы в рамках SiteSputnik Pro". Сейчас не отвлекаемся на детали.

    • Вводим запросы и указываем Источники, в которых они будут выполняться:
    • Нажимает на кнопку "Совместно" и получаем следующее готовое задание (готовый Проект), сгенеригованный программой СайтСпутник:
      Выше приведено табличное представление задания - это "живое" окно из программы SiteSputnik. Его можно перевести к тестовому виду, который будет выглядеть так: ^^+++Файл с языками\Файлы\12 языков.lng ^^Здесь список выбранных 12 языков Новости нефтегазового сектора в мире || Google=3 ^^Язык Русский Dünyadakı neft və qaz sektorunun xəbərləri || Google=3 ^^Язык Азербайджанский News of the oil and gas sector in the world || Google=3 ^^Язык Английский أخبار قطاع النفط والغاز في العالم || Google=3 ^^Язык Арабский Noticias del sector del petróleo y gas en el mundo. || Google=3 ^^Язык Испанский Notizie del settore petrolifero e del gas nel mondo || Google=3 ^^Язык Итальянский 世界石油和天然氣部門的消息 || Google=3 ^^Язык Китайский (традиционный) Nachrichten aus dem Öl- und Gassektor der Welt || Google=3 ^^Язык Немецкий Nyheter om olje- og gassektoren i verden || Google=3 ^^Язык Норвежский Dünyadaki petrol ve gaz sektörünün haberleri || Google=3 ^^Язык Турецкий Nouvelles du secteur du pétrole et du gaz dans le monde || Google=3 ^^Язык Французский 世界の石油とガスセクターのニュース || Google=3 ^^Язык Японский мировой рынок нефти и газа || Yahoo=2 ^^Язык Русский Qlobal neft və qaz bazarları || Yahoo=2 ^^Язык Азербайджанский global oil and gas market || Yahoo=2 ^^Язык Английский سوق النفط والغاز العالمي || Yahoo=2 ^^Язык Арабский mercado global de petróleo y gas || Yahoo=2 ^^Язык Испанский mercato globale del petrolio e del gas || Yahoo=2 ^^Язык Итальянский 全球石油和天然氣市場 || Yahoo=2 ^^Язык Китайский (традиционный) Weltmarkt für Öl und Gas || Yahoo=2 ^^Язык Немецкий globalt olje- og gassmarked || Yahoo=2 ^^Язык Норвежский küresel petrol ve gaz pazarı || Yahoo=2 ^^Язык Турецкий marché mondial du pétrole et du gaz || Yahoo=2 ^^Язык Французский 世界の石油とガスの市場 || Yahoo=2 ^^Язык Японский сжиженный углеводородный газ анализ и прогнозирование || Yandex=1 ^^Язык Русский maye neft analizi və proqnozlaşdırılması || Yandex=1 ^^Язык Азербайджанский liquefied petroleum gas analysis and forecasting || Yandex=1 ^^Язык Английский تحليل غاز البترول المسال والتنبؤ || Yandex=1 ^^Язык Арабский Análisis y pronóstico de gas licuado de petróleo. || Yandex=1 ^^Язык Испанский analisi e previsione di gas di petrolio liquefatto || Yandex=1 ^^Язык Итальянский 液化石油氣分析與預測 || Yandex=1 ^^Язык Китайский (традиционный) Analyse und Prognose von Flüssiggas || Yandex=1 ^^Язык Немецкий flytende petroleumsgassanalyse og prognoser || Yandex=1 ^^Язык Норвежский sıvılaştırılmış petrol gazı analizi ve tahmini || Yandex=1 ^^Язык Турецкий analyse et prévision des gaz de pétrole liquéfiés || Yandex=1 ^^Язык Французский 液化石油ガス分析と予測 || Yandex=1 ^^Язык Японский перспективы сланцевой нефти и газа || News->GoogleNew=4 ^^Язык Русский şəffaf neft və qaz perspektivləri || News->GoogleNew=4 ^^Язык Азербайджанский prospects for shale oil and gas || News->GoogleNew=4 ^^Язык Английский آفاق النفط الصخري والغاز || News->GoogleNew=4 ^^Язык Арабский perspectivas para el gas de esquisto y el gas || News->GoogleNew=4 ^^Язык Испанский prospettive per lo shale oil e gas || News->GoogleNew=4 ^^Язык Итальянский 頁岩油氣的前景 || News->GoogleNew=4 ^^Язык Китайский (традиционный) Aussichten für Schieferöl und -gas || News->GoogleNew=4 ^^Язык Немецкий utsiktene for skifer olje og gass || News->GoogleNew=4 ^^Язык Норвежский şeyl yağı ve gaz için umutları || News->GoogleNew=4 ^^Язык Турецкий perspectives pour le pétrole et le gaz de schiste || News->GoogleNew=4 ^^Язык Французский シェールオイルとガスの見通し || News->GoogleNew=4 ^^Язык Японский Перед выполнением любое задание можно отредактировать произвольным образом, например: • можно подправить машинный перевод, • можно добавить свои произвольные запросы на конкретном языке, • можно применить другие Источники.
    • Выполнив задание, получим список "Объединение". Небольшой фрагмент этого списка, взятый "живьем" из СайтСпутника, в котором сниппеты переведены с азербайджанского языка на русский язык, показан ниже:
      1. Google ...



      Коротко о наблюдении за появлением новых ссылок на заданную тему Выполнив очередной запуск сформированного выше задания, получим, в частности, следующие результаты:
      1. В списке "Ссылки новые":
          • те и только те ссылки, которые ни разу не были найдены ни в одном из предыдущих запусков.    К слову будет сказано: без средств атоматизации такое "вычислить" практически невозможно.
      2. В списке "Сайты новые":
          • те и только те сайты (домены 2-го уровня), которые ни разу не встретились ранее в адресах ссылок.
      3. В списке "Домены 3-го уровня новые":
          • те и только те домены 3-го уровня, которые ни разу не встретились ранее в адресах ссылок.
      4. В списке "Объединение":
          • все уникальные ссылки, найденные при выполнении данного конкретного запуска задания.

      Детали работы в рамках SiteSputnik Pro
      • Можно заблаговременно создавать группы языков, на которые требуется сделать перевод:
      • Можно это сделать непосредственно при формировании Проекта (смотрите по зелёной стрелочке на картинке ниже):
      • На картинке выше (смотрите по красной стрелочке) показано как можно прописать в Проекте группу языков, подготовленную заранее.
      • Параметр "Не переводить сниппеты" (коричневая стрелочка) бывает востребован, например, при мониторинге информации, когда интересен перевод не сниппета, а содержания ссылки, размещенной в сниппете.
      • Если в Проекте Вы пропишите несколько групп языков, например, следующие пять:
          • Романская группа, • Языки бывшей Югославии, • Скандинавская подгруппа, • Языки стран ОПЕК, • Идиш и Иврит, -
        то запросы будут переведены на объединении множеств языков из этих групп и выполнены.
      • Сформированные Вами группы могут иметь любые наименования и любой состав (придерживаться науке языковедение не обязательно).
      • Если Вам не нужны в Проекте запросы на русском языке, то уберите галочку, стоящую перед ним (см. первую картинку в данной публикации, на которой галочка установлена).
      • Допускается применение переводчика в Проектах, вызываемых и из Планировщика, и из bat-файлов, и в Проектах, созданных динамически.
      • Если Вы хотите в выдаче программы СайтСпутник видеть название языка, при применении которого была найдена каждая конкретная ссылка, то в "Настройках" на вкладке "Pro" установите галочку для параметра:     "Приписать Источник, Запрос и Комментарии к сниппету (ссылке)". Применение данного параметра рекомендуется.

      Работа в рамках SiteSputnik Pro+News и выше:
      • С точки зрения Пользователя всё как в обычном SiteSputnik Pro+News, а именно: Рубрика://Люди/Путин
        !Путин* /1 (Владимир | Президент)

        Рубрика://Гибридные войны/Санкции
        Санкции
          • Вы прописываете в Проекте Рубрики на Русском языке, например, динамические рубрики,    например, такие:
          • СайтСпутник в автоматическом режиме переведёт содержание (контенты) найденных ссылок из списка "Объединение" или "Ссылки новые" с исходного языка на русский язык и разложит их по Рубрикам, согласно правилам попадания в Рубрики (согласно критериям как было написано выше в первой части настоящей публикации).
          • то есть, Вы будете просматривать полнотекстовую русскоязычную выдачу и при необходимости перейдёте по ссылке к оригиналу на исходном языке, а не наоборот.
      • Если в качестве Источников Вы используете не запросы на русском языке, а "безъязычные" Источники, например, RSS-потоки или другие страницы, то СайтСпутник автоматически распознает исходный язык содержания ссылок, скачанных с таких Источников, и выполнит перевод текстов на русский язык. Применимо при мониторинге новостных потоков, созданных на самых разных языках.
      • Если в качестве Источников Вы обращаетесь к основным поисковикам или встроенным в сайты поискам, то рекомендую в Настройках (в настоящей "свежей" реализации) на вкладке +News установить галочку у параметра:     "Не выделять значимый контент ссылки (оставить его как есть)".
      • Развитие и совершенствование переводчика Google положительно скажется на качестве результатов.
      • В будущем предполагается реализация в программе СайтСпутник взаимодействия с другими переводчиками.

      Список литературы Адрес главной страницы сайта - О программе СайтСпутник. Полный список публикаций по программе собран на этой .
    Previous post Next post
    Up