вторник, 11 октября 2016 г.

Геолокация без GPS


Представляю публичную базу геопозиций телефонных вышек и Wi-Fi роутеров. Мне понадобилась стабильная и безлимитная база для приложения Android, в котором нужна была точная геолокация из всех доступных источников (GPS, Wi-Fi, Mobile). Пришлось создать базу данных положений сотовых вышек и Wi-Fi. Всех заинтересовавшихся прошу под кат.

Краткое описание работы приложения:
  1. Этап 1. Раз в несколько минут приложение запускает сбор информации о том, что «видно» мобильному телефону (GPS, Мобильные вышки, все видимые Wi-Fi) и сохраняет в локальную базу данных;
  2. Этап 2. Телефон раз в половину часа синхронизируется с удаленным сервером и сообщает свое местоположение для каждой записи из локальной базы. Каждый раз телефон узнает «а где он?», отправляя данные о мобильных вышках и Wi-Fi на сервера API.

Алгоритм определения местоположения:
  • Если виден GPS и данные «свежие» доверяем им;
  • Если есть Wi-Fi, отправляем запрос на получение положения Wi-Fi. Если найдено положение — доверяем ему;
  • Если есть мобильная станция, получаем ее положение и доверяем этому положению;
  • Если все неудачно получаем, положение по ip, к сожалению, очень не точно.

Самое интересное — это получение координат по Wi-Fi и Cell ID (идентификатор мобильной станции).

К сожалению, я не нашел ни одной публичной обширной и актуальной базы, которая предоставляла бы API без ключей и лимитов на количество запросов. Пришлось создать свою базу. Точнее две — для Wi-Fi и мобильных вышек.

Определение местоположения по Wi-Fi (оригинальная статья).

Здесь я представлю основные выкладки. Для использования API не нужно никаких ключей, не существует ограничений на количество запросов: https://api.mylnikov.org/geolocation/wifi?v=1.1&bssid={wifi bssid}
{wifi bssid} — Bssid точки доступа (MAC адрес сетевой карты точки доступа).

Точность хранимых координат около 155 метров. Количество записей около 10.3М+. База постоянно обновляется и дополняется, но я буду благодарен, если кто-нибудь предложит дополнительную открытую базу.

Определение местоположение по сотовой станции мобильного оператора (оригинальная статья).

Опять же представлю выкладки: https://api.mylnikov.org/geolocation/cell?v=1.1&mcc={mcc}&mnc={mnc}&cellid={cellid}&lac={lac}
  • mcc — Integer (Код страны);
  • mnc — Integer (Код телефонного оператора);
  • cellid — Integer (Код телефонной станции);
  • lac — Integer (Код региона или Area, Location).

Точность данных — около 1100-1600 метров. В базе 10M+ вышек. Средний возраст записи — 4 недели.

Скрипт API написан на Python, база данных - MySQL.

Мобильные сети


Открытые данные
Основной критикой в сторону моего API был вопрос: «Чем плох OpenCellID?» ответ: ничем, кроме того что в этой базе мало данных.
На данный момент у них 7,8 млн вышек. Это хороший результат для полностью открытой базы, но главный минус — это плохая точность.
Сильно помогла база Mozilla Location Service для увеличения карты покрытия открытых данных.
Из всех открытых баз я выкинул недостоверные данные, такие как радиус действия около 1200 км, либо же радиус действия 0. Т.е. вышка была «замечена» всего единожды, а следовательно, положение по ней можно оценить только качественно и по-хорошему точность 35 км как у средней соты (максимальная дальность средней соты за городом). 
Открытые данные обновляются автоматически раз в неделю. Т.е. база всегда актуальна.
Сейчас в базе 13 млн. записей. Это отличный результат покрытия по всему миру. Надеюсь, вопросов, чем это лучше OpenCellID не будет. Важно отметить что в API нет никаких ограничений за количество запросов.
Пример: https://api.mylnikov.org/geolocation/cell?v=1.1&mcc=250&mnc=02&cellid=200719106&lac=7840&data=open
Сколько данных: 13.8M+ открытых данных (уникальных вышек)

Данные «как есть»
Здесь данные, на которые не распространяются никакие лицензии.
Источников много, данные получаются достаточно достоверные.
Скачать данные напрямую нельзя, но возможно получить в любом количестве через API.
Система работы проста. Как только система получает запрос, на который не может ответить из текущей базы, производятся запросы к источникам, которые потенциально могут знать о регионе запроса.
Важно заметить что «полученные» данные проходят полный цикл обновления за месяц.
Пример: https://api.mylnikov.org/geolocation/cell?v=1.1&mcc=250&mnc=02&cellid=200719106&lac=7840

Развернутое описание работы с API геолокации по мобильным сетям

Уточненое местоположение
В документации описана функция геолокации по нескольким мобильным вышкам. Большинство открытых сервисов делать это не умеют и функция в диапазоне GSM-EDGE является крайне полезной, однако ответ API скорее носит качественную оценку геоположения. Я буду рад, если кто-нибудь напишет мне (alex@mylnikov.org) и поможет решить задачу «триангуляции» по нескольким мобильным вышкам. 
Максимальное количество точек доступа: 12
Пример: https://api.mylnikov.org/geolocation/cell?v=1.1&search=MjUwLDAyLDc4...
Потенциально, при работе некоторых телефонных аппаратов возможно получать данные о вышках нескольких телефонных операторов (либо 2 симкарты, либо супер карты телефонов, которые показывают все видимые вышки, примеров я не знаю).

Скачать данные


WiFi точки доступа


Открытые данные
Главный вклад в открытые данные привнес великолепный проектOpenWLANMap данные из данного проекта обновляются раз в неделю.
Используются еще несколько источников, о них описано в подробной документации.
Пример: https://api.mylnikov.org/wifi/main.py/get?v=1.1&bssid=00:0C:42:1F:65:E9&data=open

Данные «как есть»
Источников мало.
Скачать данные напрямую нельзя, но возможно получить в любом количестве через API.
Система работы идентична работе API для мобильных сетей.
Период обновления 1 месяц
Пример: https://api.mylnikov.org/wifi/main.py/get?v=1.1&bssid=A0:F3:C1:3B:6F:90

Развернутое описание работы с API геолокации по WiFi точкам

Уточненое местоположение
В документации описана функция геолокации по нескольким мобильным вышкам. Для точек доступа WiFi функция крайне полезная. Хотя и дает качественное положение, однако обычно сетевой адаптер мобильного устройства чаще всего получает лист всех точек доступа даже при отсутствии подключения к какой либо точке доступа. С помощью этих данных за один запрос можно получить координату с точностью до 150 метров.
Максимальное количество точек доступа: 20
Пояснение: Разумеется, данные в базе есть не о всех точках вашей квартиры, однако, те, которые будут найдены будут использованы для уточнения геопозиции.
Пример: https://api.mylnikov.org/geolocation/wifi?v=1.1&search=Mjg6Mjg6..

Скачать данные

Актуальные проблемы
  • Совершенно не ясно как выбирать данные при условии наличия более одного источника. О некоторых точках доступа известно нескольким сервисам, причем неизвестно у кого из них данные более свежие и точные.
  • Не известно где искать дополнительные источники данных. Буду благодарен любому источнику.
  • Нагрузка после первой статьи сильно не увеличилась. Возникает ощущение что сервис не слишком интересен, возможно это из-за недоверия или молодости проекта.
  • «Уточненная» геолокация работает мягко говоря плохо.

Кейсы использования
С моей точки зрения API может быть полезно различным приложениям от геолокационых приложений до скрытого таргетинга контента приложений


Лицензирование
Лицензирование у проекта несколько хитрое.
Через одно API (для мобильных вышек и WiFi точек доступа соответственно) доступно два проекта.
  1. ключ data=open. Данный ключ дает гарантию, что данные из ответа были получены исключительно из открытых источников. Данные распространяются под лицензией MIT
  2. отсутствие ключа data=open не дает никаких гарантий об источниках данных, а также данная часть проекта не лицензируется вовсе.

Доступность
Работоспособность сервиса «почти» гарантирован в течении 3х лет, точнее до конца 2018 года при наличии высого количества запросов со стороны пользователей и 1 года при отсутствии нагрузки. 
Фактически работает два сервера в назависимых дата-центрах.
Средний показатель uptime за последний квартал 99,923% (по данным Яндекс.Метрики).
Обратная совместимость каждой версии API гарантирована через ключ «v=» бессрочно.

Пояснение
Ни при каких обстоятельствах я не претендую на владение данными этого проекта. Я лишь хочу, чтобы в интернете был достоверный обширный и доступный источник геолокационных данных. Все данные принадлежат правообладателям.

P.S. Я доступен в любое время дня и ночи по электронной почте alex@mylnikov.org и готов выслушать любую критику, пожелания и предложения.


суббота, 13 августа 2016 г.

Как обучается ИИ / Блог компании Mail.Ru Group / Geektimes

Как обучается ИИ / Блог компании Mail.Ru Group / Geektimes:



'via Blog this'

Самое главное о нейронных сетях. Лекция в Яндексе / Блог компании Яндекс / Хабрахабр

Самое главное о нейронных сетях. Лекция в Яндексе / Блог компании Яндекс / Хабрахабр:



'via Blog this'

Kaggle – наша экскурсия в царство оверфита / Хабрахабр

Kaggle – наша экскурсия в царство оверфита / Хабрахабр:



'via Blog this'

Производительность Java: настоящее и будущее / Блог компании JUG.ru Group / Хабрахабр

Производительность Java: настоящее и будущее / Блог компании JUG.ru Group / Хабрахабр:



'via Blog this'

Обучение машины — забавная штука: современное распознавание лиц с глубинным обучением / Хабрахабр

Обучение машины — забавная штука: современное распознавание лиц с глубинным обучением / Хабрахабр:



'via Blog this'