Получение уникальных значений поля списка

Сегодня пост об использовании не совсем правильного подхода при решении очень часто встречающейся проблемы при разработке решений на базе SharePoint: получение набора уникальных значений поля списка. Описанный мною метод относится к спискам/библиотекам, содержащим более 5000 элементов.

Принцип решения

При получении данных из списка SharePoint есть одно досадное ограничение: он не поддерживает получение уникальных значений, т.к. в любом случае выбирает такие уникальные поля как ID, UniqueId и прочие. Поэтому для решения описанной выше задачи приходится обходить объектную модель SharePoint и выбирать данные напрямую из базы данных содержимого.

База данных содержимого

Все данные списков/библиотек документов в SharePoint хранятся в одной единственной таблице dbo.AllUserData базы данных содержимого. Для начала, вот так выглядит в SharePoint иерархия содержимого сверху-вниз:

Иерархия содержимого SharePoint

У приложения (SPWebApplication) может быть одна или более база содержимого. И при этом у коллекции сайтов (SPSite) и всех нижестоящих элементов иерархии база содержимого одна. Но мы будем "подниматься" по этой иерархии снизу и выбирать нам не придется.

  1. // Путь к строке подключения от поля списка
  2. SPFieldObject.ParentList.ParentWeb.Site.ContentDatabase.DatabaseConnectionString

SchemaXml

Фильтровать данные в таблице dbo.AlllUserData мы будем по следующим полям

  • tp_ListId - Id списка, из которого мы будем выбирать данные;
  • tp_IsCurrent - флаг, указывающий на текущую версию;
  • tp_RowOrdinal - номер строки. Он используется если полей в таблице не хватает для хранения значений полей. По умолчанию, максимальное кол-во строк, для одного элемента списка/библиотеки документов равно 6;
  • tp_DeleteTransactionId - Id транзакции удаления. Если элемент не удален, то значение этого поля будет равно 0x

И последний параметр - само поле, где хранится значение. Все эти параметры мы будем брать из схемы поля, представленного свойством SchemaXml:

  1. <Field ID="{0eb872f2-94a8-455b-9c0f-529dd0688a41}" Name="AccessLevel"
  2.     DisplayName="AccessLevel" Type="Integer"
  3.     ColName="int4"
  4.     StaticName="AccessLevel"
  5.     SourceID="{7D206E84-E96D-4D2D-A503-88E4702D7409}"
  6.     Indexed="TRUE" Version="1" RowOrdinal="0">
  7. </Field>

И SQL-запрос будет выглядеть примерно так:

  1. select top 10
  2.     int4
  3. from
  4.     dbo.AllUserData (nolock)
  5. where
  6.     tp_ListId = '7D206E84-E96D-4D2D-A503-88E4702D7409'
  7.     and 
  8.     tp_IsCurrent = 1
  9.     and                    
  10.     tp_RowOrdinal = 0
  11.     and
  12.     tp_DeleteTransactionId = 0x
  13. order by
  14.     1 asc

Решение

Решение будет представлять из себя метод-расширитель для объектов типа SPField. Для начала "болванка" для построение SQL-запроса:

  1. public static string FieldDistinctValues =
  2.         @"select distinct
  3.             %SqlColName%
  4.         from
  5.             dbo.AllUserData
  6.         where
  7.             tp_ListId = @ListId
  8.             and tp_IsCurrent = 1
  9.             and
  10.             tp_RowOrdinal = @RowOrdinal
  11.             and
  12.             tp_DeleteTransactionId = 0x
  13.         order by
  14.             1 asc";

Здесь %SqlColName% мы будем подменять названием колонки из атрибута ColName. Остальные @Параметры будем подставлять, используя стандартный функционал:

  1. /// <summary>
  2. /// Получение уникальных значений поля списка
  3. /// </summary>
  4. /// <typeparam name="TValue">Тип поля</typeparam>
  5. /// <param name="field">Поле списка</param>
  6. /// <returns></returns>
  7. public static IEnumerable<TValue> DistinctValues<TValue>(this SPField field)
  8. {
  9.     var connectionString = string.Empty;
  10.     var res = new List<TValue>();
  11.     SPSecurity.RunWithElevatedPrivileges(
  12.         () =>
  13.         {
  14.             //Получаем ID сайта
  15.             var siteId = field.ParentList.ParentWeb.Site.ID;
  16.             // Инициализируем новый сайт с правами учетной записи пула приложения
  17.             using (var site = new SPSite(siteId))
  18.             {
  19.                 connectionString = site.ContentDatabase.DatabaseConnectionString;
  20.             }
  21.             // Получаем значение атрибута ColName
  22.             var colName = field.AttributeValue("ColName");
  23.             var ordinal = field.AttributeValueAsInteger("RowOrdinal");
  24.             var listId = field.ParentList.ID;
  25.             // Создаем комманду
  26.             using (var cmd = new SqlCommand(
  27.                     FieldDistinctValues.Replace("%SqlColName%", colName))
  28.                     {
  29.                         CommandType = CommandType.Text
  30.                     })
  31.             {
  32.                 cmd.Parameters.Add(new SqlParameter("@ListId", listId));
  33.                 cmd.Parameters.Add(new SqlParameter("@RowOrdinal", ordinal));
  34.                 // Инициализируем подключение к базе данных
  35.                 using (var con = new SqlConnection(connectionString))
  36.                 {
  37.                     cmd.Connection = con;
  38.                     con.Open();
  39.                     var reader = cmd.ExecuteReader();
  40.                     while (reader != null && reader.Read())
  41.                     {
  42.                         // Заполняем полученные значения
  43.                         res.Add(reader[0] is TValue 
  44.                             ? (TValue) reader[0] 
  45.                             : default(TValue));
  46.                     }
  47.                 }
  48.                 if (cmd.Connection.State != ConnectionState.Closed)
  49.                 {
  50.                     cmd.Connection.Close();
  51.                 }
  52.             }
  53.         });
  54.     return res;
  55. }

Выбирать данные из базы данных, минуя объектную модель как минимум некрасиво, т.к. её структура может измениться, но во-первых эта структура (таблица dbo.AllUserData) остается со времен Windows SharePoint Service 2.0, а во-вторых, получаемый прирост производительности оправдывает такое решение.

Производительность

Производительность я измерял, используя список с 10.000 элементами и производил выборку уникальных значений трех полей. Самих уникальных значений в этих полях было 2, 5 и 2045. Каждый запрос я выполнял десять раз и измерял среднее время исполнения. Вот, что у меня получилось:

Сравнение производительности прямого SQL-запроса и объектной модели

Теперь я добавил ещё один момент к выборке данных: подсчет количества элементов в списке. В случае с SQL-запросом надо просто добавить group by. А в случае с объектной моделью группировку придется выполнять в памяти.

Сравнение производительности прямого SQL-запроса и объектной модели при использовании группировки

Результат мало чем отличается от предыдущего. Разница в производительности здесь объясняется очень просто: использую объектную модель SharePoint все равно приходится выбирать все данные из списка. В случае, когда уникальных значений в списке всего два, а самих элементов 10000, придется "вытянуть" 10000 значений из списка SharePoint и только потом в памяти искать уникальные значения.

Можно еще усложнить запрос, добавив к нему предикат для предварительной фильтрации данных, например для реализации быстрого автокомплита в поле.

As is

В заключение еще раз напомню, что выбирать данные напрямую из базы данных, миную объектную модель - это плохо и очень плохо. Поэтому используйте описанный выше метод на свой страх и риск.

Виталий Жуков

Виталий Жуков

SharePoint архитектор, разработчик, тренер, Microsoft MVP (Office Development). Более 15 лет опыта работы с SharePoint, Dynamics CRM, Office 365, и другими продуктами и сервисами Microsoft.

Смотрите также

Новый сайт группы SharePoint. Как это работает

Новый сайт группы SharePoint. Как это работает

SharePoint 2019 Preview

SharePoint 2019 Preview

Управление большими списками/библиотеками в SharePoint

Управление большими списками/библиотеками в SharePoint

SharePoint 2013/2016. Настройка хлебных крошек

SharePoint 2013/2016. Настройка хлебных крошек

SharePoint 2016. Кастомизация меню SuiteBar

SharePoint 2016. Кастомизация меню SuiteBar

SharePoint 2016. Кастомизация SuiteBar

SharePoint 2016. Кастомизация SuiteBar

Домашняя страница сайта SharePoint

Домашняя страница сайта SharePoint

Презентация и скрипты со встречи сообщества по SharePoint и Office 365

Презентация и скрипты со встречи сообщества по SharePoint и Office 365

PowerShell DSC. SharePoint

PowerShell DSC. SharePoint

PowerShell DSC. Сертификат для шифрования пароля

PowerShell DSC. Сертификат для шифрования пароля

PowerShell DSC. Учетные записи

PowerShell DSC. Учетные записи

Встреча сообщества по SharePoint и Office 365

Встреча сообщества по SharePoint и Office 365

SharePoint 2016. QR-code

SharePoint 2016. QR-code

Возможности SharePoint 2010/2013/2016

Возможности SharePoint 2010/2013/2016

Gmail IIS SMTP relay

Gmail IIS SMTP relay

SharePoint 2016. Извещения мозаикой

SharePoint 2016. Извещения мозаикой

Сертификация SharePoint по-новому

Сертификация SharePoint по-новому

SharePoint. Получение списка сайтов

SharePoint. Получение списка сайтов

Планирование фермы SharePoint

Планирование фермы SharePoint

Обзор SharePoint Education. Часть 3

Обзор SharePoint Education. Часть 3

SharePoint Excel Services. Отображение диаграммы на странице

SharePoint Excel Services. Отображение диаграммы на странице

SharePoint 2016 Release Candidate

SharePoint 2016 Release Candidate

Обзор SharePoint Education. Часть 2

Обзор SharePoint Education. Часть 2

Обзор SharePoint Education. Часть 1

Обзор SharePoint Education. Часть 1

SharePoint 2013 Образование. Установка и настройка

SharePoint 2013 Образование. Установка и настройка

SharePoint 2016 IT Preview

SharePoint 2016 IT Preview

SharePoint и SMS. Часть 2. Регистрация OMS-сервиса

SharePoint и SMS. Часть 2. Регистрация OMS-сервиса

SharePoint и SMS. Часть 1. Создание OMS веб-сервиса

SharePoint и SMS. Часть 1. Создание OMS веб-сервиса

SharePoint Day: 14 декабря, Москва

SharePoint Day: 14 декабря, Москва

RuSUG 17.10.2013. Презентация с моего доклада о новом поиске в SharePoint 2013

RuSUG 17.10.2013. Презентация с моего доклада о новом поиске в SharePoint 2013

SharePoint 2013 Ribbon API. Версии 14.3 и 15.4

SharePoint 2013 Ribbon API. Версии 14.3 и 15.4

Встреча RuSUG 17-го октября

Встреча RuSUG 17-го октября

SharePoint 2013. Служба ServiceDesk за 8 часов либо правильный проект

SharePoint 2013. Служба ServiceDesk за 8 часов либо правильный проект

SharePoint 2010/2013. Локализация данных

SharePoint 2010/2013. Локализация данных

Список возможностей SharePoint 2013

Список возможностей SharePoint 2013

SharePoint 2013. Типы полей

SharePoint 2013. Типы полей

SharePoint 2013 Enterprise Search. Часть 2. Создание обработчика контента

SharePoint 2013 Enterprise Search. Часть 2. Создание обработчика контента

SharePoint 2013 Enterprise Search. Часть 1. Логическая архитектура

SharePoint 2013 Enterprise Search. Часть 1. Логическая архитектура

SharePoint Ribbon. Создание многоуровневого меню

SharePoint Ribbon. Создание многоуровневого меню

SharePoint Ribbon. Использование ColorPicker'а

SharePoint Ribbon. Использование ColorPicker'а

Разработка для SharePoint. Как это было и как это будет

Разработка для SharePoint. Как это было и как это будет

SharePoint. История социализма за 10 лет

SharePoint. История социализма за 10 лет

SharePoint 2013 Preview

SharePoint 2013 Preview

Использование штрихкодов в SharePoint 2010

Использование штрихкодов в SharePoint 2010

Unable to locate the xml-definition for FieldName

Unable to locate the xml-definition for FieldName

SharePoint 2010. Апрельский накопительный пакет обновлений

SharePoint 2010. Апрельский накопительный пакет обновлений

Не удалось найти XML-файл в указанном расположении

Не удалось найти XML-файл в указанном расположении

Служба синхронизации профилей пользователей. Ошибки

Служба синхронизации профилей пользователей. Ошибки

Делаем сайт на SharePoint 2010. Построение иерархии страниц

Делаем сайт на SharePoint 2010. Построение иерархии страниц

Делаем сайт на SharePoint 2010. Брендинг Wiki-страниц

Делаем сайт на SharePoint 2010. Брендинг Wiki-страниц

Делаем сайт на SharePoint 2010. Оптимизация

Делаем сайт на SharePoint 2010. Оптимизация

Делаем сайт на SharePoint 2010. Брендинг

Делаем сайт на SharePoint 2010. Брендинг

Обработка большого количества элементов в SharePoint

Обработка большого количества элементов в SharePoint

DeskWork 5. Функциональность (продолжение)

DeskWork 5. Функциональность (продолжение)

Сокрытие информации о пользователе создавшем/изменившем элемент

Сокрытие информации о пользователе создавшем/изменившем элемент

Error : Code blocks are not allowed in this file

Error : Code blocks are not allowed in this file

SharePoint Client Object Model. Управляемый код

SharePoint Client Object Model. Управляемый код

Использование контрола HtmlEditor. Часть 3

Использование контрола HtmlEditor. Часть 3

SharePoint 15 SDK

SharePoint 15 SDK

PeopleEditor и Internet Explorer 9

PeopleEditor и Internet Explorer 9

Использование контрола HtmlEditor. Часть 2

Использование контрола HtmlEditor. Часть 2

Использование контрола HtmlEditor. Часть 1

Использование контрола HtmlEditor. Часть 1

Пропадающий контрол выбора представления списка

Пропадающий контрол выбора представления списка

Развертывание библиотеки документов с файлами

Развертывание библиотеки документов с файлами

Отключенные учетные записи и PeoplePicker

Отключенные учетные записи и PeoplePicker

Пропадающий TextBox в Telerik Reporting

Пропадающий TextBox в Telerik Reporting

Длительные операции в SharePoint. Request timed out

Длительные операции в SharePoint. Request timed out

Длительные операции в SharePoint. Изнутри

Длительные операции в SharePoint. Изнутри

Длительные операции в SharePoint. Снаружи

Длительные операции в SharePoint. Снаружи

DeskWork. Версия 5.1

DeskWork. Версия 5.1

DeskWork 5. Часть 2. Функциональность

DeskWork 5. Часть 2. Функциональность

DeskWork 5. Часть 1. Установка

DeskWork 5. Часть 1. Установка

SharePoint 2010. Random ListItem

SharePoint 2010. Random ListItem

Custom ListDefinition. Отключаем диалоги

Custom ListDefinition. Отключаем диалоги

SharePoint 2010 UpdatePanel. Request Notification

SharePoint 2010 UpdatePanel. Request Notification

Получение размера вложений SPListItem'а

Получение размера вложений SPListItem'а

SharePoint 2010. Переопределение форм типа содержимого

SharePoint 2010. Переопределение форм типа содержимого

SharePoint 2007/2010. Привязываем EventReceiver к типу содержимого

SharePoint 2007/2010. Привязываем EventReceiver к типу содержимого

Изменяем appSettings в config-файле

Изменяем appSettings в config-файле

SharePoint 2010. Добавляем сборку в пакет

SharePoint 2010. Добавляем сборку в пакет

SharePoint 2007/2010. The security validation for this form is invalid

SharePoint 2007/2010. The security validation for this form is invalid

SharePoint 2010. JavaScript IntelliSence

SharePoint 2010. JavaScript IntelliSence

SharePoint 2010. Локализация SiteDefinition

SharePoint 2010. Локализация SiteDefinition

SharePoint 2007. Получение данных из нескольких списков и узлов

SharePoint 2007. Получение данных из нескольких списков и узлов

SharePoint 2007. Максимальное/минимальное значение поля в списке

SharePoint 2007. Максимальное/минимальное значение поля в списке

SharePoint 2007. Свой контрол на панели свойств веб-парта

SharePoint 2007. Свой контрол на панели свойств веб-парта

SharePoint 2007. База данных содержимого

SharePoint 2007. База данных содержимого

SharePoint 2007. Проверка на наличие элемента в списке

SharePoint 2007. Проверка на наличие элемента в списке