Свежие данные GBIF (10 августа 2021 г.): Россия уже на втором месте!

Дорогие друзья!

Постепенно к сообществу проекта "Флора России" присоединяются всё новые пользователи. Изредка мы рассказываем о том, как взаимодействуют iNaturalist и GBIF.

Итак, Global Biodiversity Information Facility (https://www.gbif.org/) - это глобальная платформа-агрегатор данных о биоразнообразии. Их здесь очень много: 1 889 157 166 фактов присутствия того или иного вида в той или иной точке. Это и наблюдения, и образцы, и окаменелости, и данные литературы. Чтобы все эти данные оказались доступны в одном месте, 1716 организаций по всему миру объединили здесь свои 61 514 баз данных - больших и малых.

Любой пользователь может освоить несложную поисковую систему GBIF (https://www.gbif.org/occurrence/search) и найти то, что ему интересно. Система поисковых фильтров GBIF отличается богатым выбором настроек и стремительным отображением результатов, несмотря на гигантские объемы данных. Мой опыт показывает, что искать здесь отдельные наблюдения гораздо быстрее, чем на iNaturalist.

Конечно, среди баз данных о биоразнообразии есть очень большие массивы! Вот, как выглядит десятка самых больших:

1) EOD – eBird Observation Dataset 872 206 403
2) Artportalen (Swedish Species Observation System) 82 017 115
3) Observation.org, Nature data from around the World 39 969 765
4) iNaturalist Research-grade Observations 31 843 881
5) DOF - Observations from the Danish Ornithological Society 27 109 616
6) Norwegian Species Observation Service 25 615 763
7) INPN - Données flore des CBN agrégées par la FCBN 20 999 334
8) Southern African Bird Atlas Project 2 17 561 423
9) Waarnemingen.be - Bird occurrences in Flanders and the Brussels Capital Region, Belgium 12 811 851
10) NSW BioNet Atlas 12 642 938

А вот как выглядит другая десятка - с данными по сосудистым растениям.

1) INPN - Données flore des CBN agrégées par la FCBN 20 960 245
2) Artportalen (Swedish Species Observation System) 14 230 807
3) iNaturalist Research-grade Observations 12 093 278
4) Dutch Vegetation Database 11 108 843
5) The Danish Environmental Portal, species and habitats-database "Danmarks Miljøportals Naturdatabase" 10 798 304
6) Pl@ntNet automatically identified occurrences 9 634 639
7) Flora von Deutschland (Phanerogamen) 9 197 488
8) BSBI data from several English counties, up to 2015 8 158 299
9) Flore du Bassin parisien (CBNBP) 7 781 816
10) Floristic records from survey studies of the Bayerisches Landesamt für Umwelt 7 112 618

Как видно из обоих списков, данные из iNaturalist являются одним из ведущих источников данных в GBIF - как по всем группам живых организмов (4-е место), так и по сосудистым растениям (3-е место).

На iNaturalist 76,3 млн наблюдений, а в GBIF попадает лишь 31,8 млн (https://doi.org/10.15468/ab3s5x). Почему? Дело в том, что одновременно:

  • наблюдение должно иметь исследовательский статус;
  • наблюдение должно иметь открытую лицензию (CC0, CC-BY, CC-BY-NC);
  • а сами данные при этом публикуются с задержкой (сейчас данные от 29.07.2021).

Давайте сравним две ссылки на одно и то же наблюдение:

https://www.gbif.org/occurrence/2882925758
https://www.inaturalist.org/observations/61666594

Автор не указал своего настоящего имени в профиле, поэтому в GBIF он числится как "ctahkih". Не нужно менять ник - достаточно указать настоящее имя в профиле в соответствующем разделе (лучше латиницей!). В паспорте наблюдения на iNaturalist есть ссылка на GBIF ("Это наблюдение размещено на 1 сайте: GBIF"), обратная ссылка на сайте GBIF имеется с момента заливки. Интересно и то, что это наблюдение было создано с помощью приложения Seek.

У GBIF своя номенклатура, которая автоматически стыкуется с названиями iNat, а также имеется в расширенном поиске фильтр по автору находки, так что можете выбрать и посмотреть, какие ваши наблюдения попали в GBIF. Недавно там появился поиск по административным единицам (правда, карта заложена 10-летней давности, так что границы Москвы и Подмосковья, например, старые).

Если вы хотите, чтобы ваши наблюдения попали в GBIF, то необходимо удостовериться, что у вас выставлена открытая лицензия. О том, как это сделать написано с иллюстрацией в этом посте: https://www.inaturalist.org/projects/flora-of-russia/journal/39331-obnovlen-massiv-dannyh-inaturalist-v-gbif-11-avgusta . Если у вас не проставлена лицензия, то в карточке каждого наблюдения у вас в правом нижнем углу написано "Все права защищены", если проставлена, то, как правило, - "Некоторые права защищены".

Отдельно отметим, что все топ-100 наблюдателей проекта "Флора России" перешли на свободные лицензии. Доля наблюдений проекта, заблокированных жёсткими лицензиями, сократилась до 10,8%! Это наше большое общее достижение в деле открытого доступа к данным о биоразнообразии. Большое спасибо, что не оставили без внимания предыдущие посты о GBIF. Возможно, в этот раз отклик будет еще шире.

Зачем всё это нужно?

Самый простой ответ заключается в том, что именно из GBIF исследователи выгружают данные о растениях, грибах и животных в удобном виде (csv-выгрузки). Каждая такая выгрузка получает doi, с помощью которого отслеживаются цитирования в научных исследованиях. Так, массив данных iNaturalist (https://doi.org/10.15468/ab3s5x ) процитирован через GBIF уже 1455 раз! Это рекорд среди всех участников GBIF.


ДОГОНЯЛКИ

Традиционно летом мы устраиваем догонялки с разными странами мира, глядя на оперативно обновляемые данные GBIF . Этим летом по разным поводам мы догоняем Канаду, Мексику и США. Итак, дамы и господа, я рад сообщить, что мы опередили первого соперника - Канаду!

= Цель 1: догнать Канаду по числу наблюдений сосудистых растений из iNaturalist в GBIF =

Текущая раскладка такова:

1) United States of America 6 089 137
2) Russian Federation 1 077 377
3) Canada 1 070 691
4) South Africa 398 411
5) Mexico 376 785

Наше преимущество после очередного обновления - 6,7 тыс. наблюдений. Посмотрим, что будет дальше. Как правило, осенью в Канаде немного интенсивнее, чем в России, накапливаются данные по растениям.

= Цель 2: догнать Мексику по числу наблюдений сосудистых растений в GBIF (из всех баз) =

11) Belgium 9,732,610
12) Switzerland 7,276,232
13) Finland 7,228,062
14) Norway 6,298,055
15) Mexico 5,267,906
16) Russian Federation 3,307,873
17) Japan 3,229,874
18) Canada 2,940,593
19) Portugal 2,800,700
20) China 2,500,260

Здесь отрывы гигантские и отставание от Мексики растёт. Однако в этом зачёте участвуют все источники информации, поступающие в GBIF. Российские учреждения регулярно публикуют новые данные по флоре России (прежде всего, оцифрованные гербарные коллекции), поэтому смотрим с надеждой на будущее. Пока наше отставание 1,96 млн записей.

= Цель 3: догнать США по числу наблюдений сосудистых растений из iNaturalist в GBIF на месячных отсечках =

Вот, что у нас получается за июль:

1) United States of America 139 421
2) Russian Federation 67 086
3) Canada 46 069
4) United Kingdom of Great Britain and Northern Ireland 14 979
5) Germany 10 430

Пока отставание в 2,1 раза. В прошлом году мы сокращали его до отметки в 1,6 раз. Посмотрим, что будет в августе и сентябре.


На данный момент в GBIF индексируется уже 7,09 млн записей о биоразнообразии России - 6,92 млн с основной территории и 0,17 млн из Крыма. При этом, iNaturalist является самым большим по объему источником данных о природе России (занимает долю 24,4% по основной территории и 49,7% по Крыму). Эта доля постоянно растёт благодаря нашим усилиям.

Вот, какие массивы данных по биоразнообразию России являются крупнейшими сегодня:

1) iNaturalist Research-grade Observations 1 689 010
2) Moscow University Herbarium (MW) 659 566
3) RU-BIRDS.RU, Birds observations database from Russia and neighboring regions 480 320
4) EOD – eBird Observation Dataset 387 883
5) Geographically tagged INSDC sequences 195 451
6) Locations of plants on dot distribution maps in the Flora of Siberia (Flora Sibiraea, 1987–1997) 169 854
7) Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) 130 054
8) Finnish Floristic Database (Finnish Museum of Natural History Collections) 106 396
9) Birds of Northern Eurasia 86 992
10) L. IS dataset. Cyanoprocaryota, Lichens, Bryophyte 86 579

Publicado el miércoles, 11 de agosto de 2021 a las 04:32 AM por apseregin apseregin

Comentarios

Два вопроса про компиляцию данных.
1) Уточняется ли в GBIF наблюдение, если со временем на iNaturalist наблюдение переопределили?
2) То же в отношении культивируемых растений. После дополнительных запросов наблюдатель сменил статус "дикорастущего" на "в неволе". GBIF это учитывает?

Anotado por phlomis_2019 hace mas de 2 años

Насколько мне известно - после синхронизации данных да. Потому что при удалении с натуралиста - там тоже пропадает

Anotado por yurii_basov hace mas de 2 años

Да, совершенно верно. Синхронизация осуществляется время от времени. Как правило, раз в 2 или в 3 недели.

Anotado por apseregin hace mas de 2 años

Отлично! Они бы еще удалили автоматические определения PlantNet'а. Там много откровенных ляпов.

Anotado por phlomis_2019 hace mas de 2 años

Да, это есть такое.. Ещё и кажется каждая фотография как отдельное наблюдение идёт

Anotado por yurii_basov hace mas de 2 años

Añade un comentario

Entra o Regístrate para añadir comentarios