Свежие данные GBIF (17 ноября 2021 г.)

Дорогие друзья!

Постепенно к сообществу проекта "Флора России" присоединяются всё новые пользователи. Изредка мы рассказываем о том, как взаимодействуют iNaturalist и GBIF. Пост месячной давности тут: https://www.inaturalist.org/posts/58530-svezhie-dannye-gbif-15-oktyabrya-2021-g .

Итак, Global Biodiversity Information Facility (https://www.gbif.org/) - это глобальная платформа-агрегатор данных о биоразнообразии. Их здесь очень много: 1 901 456 623 фактов присутствия того или иного вида в той или иной точке. Это и наблюдения, и образцы, и окаменелости, и данные литературы. Чтобы все эти данные оказались доступны в одном месте, 1760 организаций по всему миру объединили здесь свои 63 496 баз данных - больших и малых. Российские организации (университеты, академические институты, музеи, ООПТ) опубликовали в GBIF 548 базы данных.

Любой пользователь может освоить несложную поисковую систему GBIF (https://www.gbif.org/occurrence/search) и найти то, что ему интересно. Система поисковых фильтров GBIF отличается богатым выбором настроек и стремительным отображением результатов, несмотря на гигантские объемы данных. Мой опыт показывает, что искать здесь отдельные наблюдения гораздо быстрее, чем на iNaturalist. Кроме того, удобно, следуя гиперссылкам, исправлять определение какой-нибудь случайной ошибки из числа наблюдений iNat, прошедших в GBIF.

Конечно, среди баз данных о биоразнообразии есть очень большие массивы! Вот, как выглядит сейчас десятка самых больших:

1) EOD – eBird Observation Dataset 872 206 403
2) Artportalen (Swedish Species Observation System) 82 017 124
3) Observation.org, Nature data from around the World 39 969 765
4) iNaturalist Research-grade Observations 36 167 804
5) DOF - Observations from the Danish Ornithological Society 27 556 877
6) Norwegian Species Observation Service 26 175 818
7) INPN - Données flore des CBN agrégées par la FCBN 20 999 334
8) Southern African Bird Atlas Project 2 17 847 718
9) USGS PWRC - Bird Banding Lab - US State Centroid - 1960-2010 14 079 367
10) Waarnemingen.be - Bird occurrences in Flanders and the Brussels Capital Region, Belgium 12 811 851

А вот как выглядит другая десятка - с данными по сосудистым растениям.

1) INPN - Données flore des CBN agrégées par la FCBN 20 960 245
2) Artportalen (Swedish Species Observation System) 14 230 810
3) iNaturalist Research-grade Observations 13 809 844
4) Dutch Vegetation Database 11 108 843
5) The Danish Environmental Portal, species and habitats-database "Danmarks Miljøportals Naturdatabase" 10 869 918
6) Pl@ntNet automatically identified occurrences 9 634 639
7) Flora von Deutschland (Phanerogamen) 9 255 906
8) BSBI data from several English counties, up to 2015 8 158 299
9) Flore du Bassin parisien (CBNBP) 7 781 823
10) Floristic records from survey studies of the Bayerisches Landesamt für Umwelt 7 549 052

Как видно из обоих списков, данные из iNaturalist являются одним из ведущих источников данных в GBIF - как по всем группам живых организмов (4-е место), так и по сосудистым растениям (3-е место). И эти данные постоянно растут. По прогнозам и динамике, iNat выйдет на второе место по сосудистым растениям уже в начале следующего года, а летом станет первым. И нашему сообществу предстоит сыграть в этом ключевую роль.

На iNaturalist 85,6 млн "проверяемых" наблюдений (https://www.inaturalist.org/observations), а в GBIF попадает лишь 36,2 млн (https://doi.org/10.15468/ab3s5x). Почему? Дело в том, что одновременно:

  • наблюдение должно иметь исследовательский статус;
  • наблюдение должно иметь открытую лицензию (CC0, CC-BY, CC-BY-NC);
  • а сами данные при этом публикуются с задержкой (сейчас данные от 4.11.2021).

Давайте сравним две ссылки на одно и то же наблюдение:

https://www.gbif.org/occurrence/3017963860
https://www.inaturalist.org/observations/67518248

Автор не указал своего полного имени в профиле, поэтому в GBIF он числится как "Denis". Так что стоит указать полное имя в профиле в соответствующем разделе (лучше латиницей!). Автором определения значится в GBIF Игорь Поспелов, поскольку он первый указал правильное название вида. Ссылка на автора определения нормируется с помощью номера ORCID, который каждый пользователь может привязать в своем личном кабинете. В паспорте наблюдения на iNaturalist есть ссылка на GBIF ("Это наблюдение размещено на 1 сайте: GBIF"), обратная ссылка на сайте GBIF имеется с момента заливки.

У GBIF своя номенклатура (так называемый "GBIF Backbone"), которая автоматически стыкуется с названиями iNat, а также имеется в расширенном поиске фильтр по автору находки, так что можете выбрать и посмотреть, какие ваши наблюдения попали в GBIF. Недавно там появился поиск по административным единицам (правда, карта заложена 10-летней давности, так что границы Москвы и Подмосковья, например, старые).

Если вы хотите, чтобы ваши наблюдения попали в GBIF, то необходимо удостовериться, что у вас выставлена открытая лицензия. Это можно сделать как через сайт, так и через приложение в настройках учётной записи. Если у вас не проставлена лицензия, то в карточке каждого наблюдения у вас в правом нижнем углу написано "Все права защищены", если проставлена, то, как правило, - "Некоторые права защищены".

Отдельно отметим, что все топ-100 наблюдателей проекта "Флора России" перешли на свободные лицензии. Доля наблюдений проекта, заблокированных жёсткими лицензиями, сократилась сейчас до рекордной отметки в 10,0%! Это наше большое общее достижение в деле открытого доступа к данным о биоразнообразии. Большое спасибо, что не оставили без внимания предыдущие посты о GBIF. Возможно, в этот раз отклик будет еще шире.

Зачем всё это нужно?

Самый простой ответ заключается в том, что именно из GBIF исследователи выгружают данные о растениях, грибах и животных в удобном виде (csv-выгрузки). Каждая такая выгрузка получает doi, с помощью которого отслеживаются цитирования в научных исследованиях. Так, массив данных iNaturalist (https://doi.org/10.15468/ab3s5x ) процитирован через GBIF уже 1909 раз! Это рекорд среди всех участников GBIF.


РОССИЯ

На данный момент в GBIF индексируется уже 7,83 млн записей о биоразнообразии России - 7,62 млн с основной территории и 0,21 млн из Крыма. При этом, iNaturalist является самым большим по объему источником данных о природе России (занимает долю 26,5% по основной территории и 49,6% по Крыму). Эта доля постоянно растёт благодаря нашим усилиям.

Вот, какие массивы данных по биоразнообразию России являются крупнейшими сегодня:

1) iNaturalist Research-grade Observations 2 017 123
2) Moscow University Herbarium (MW) 659 680
3) RU-BIRDS.RU, Birds observations database from Russia and neighboring regions. Zoological Museum of M.V. Lomonosov Moscow State University. 506 974
4) EOD – eBird Observation Dataset 387 883
5) Locations of plants on dot distribution maps in the Flora of Siberia (Flora Sibiraea, 1987–1997) 169 854
6) FLORUS: miscellaneous records 141 294
7) Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) 130 054
8) Finnish Floristic Database (Finnish Museum of Natural History Collections) 106 396
9) Birds of Northern Eurasia 86 992
10) Chronicle of Nature - Phenology of Plants of Zhiguli Nature Reserve 86 524

А вот, что есть в GBIF по сосудистым растениям России:

1) iNaturalist Research-grade Observations 1 305 463
2) Moscow University Herbarium (MW) 587 681
3) Locations of plants on dot distribution maps in the Flora of Siberia (Flora Sibiraea, 1987–1997) 169 854
4) FLORUS: miscellaneous records 141 294
5) Flora of Vladimir Oblast, Russia: an updated grid dataset (1867–2020) 130 054
6) Finnish Floristic Database (Finnish Museum of Natural History Collections) 106 241
7) Chronicle of Nature - Phenology of Plants of Zhiguli Nature Reserve 86 524
8) MHA Herbarium: collections of vascular plants 80 031
9) Pl@ntNet automatically identified occurrences 71 567
10) A global database for the distributions of crop wild relatives 69 255

Anotado por apseregin apseregin, 18 de noviembre de 2021 a las 03:07 PM

Comentarios

Скажите, а что значит "Ссылка на автора определения нормируется с помощью номера ORCID", в частности что в данном контексте значит "нормируется"? Как раз недавно пытался вспомнить чем тут хорош и полезен орцид, но не смог, не смог и сейчас, прочтя.

Anotado por oleg_kosterin hace cerca de un año (Advertencia)

Añade un comentario

Entra o Regístrate para añadir comentarios