Главная » Java » Класс Hashtable

0

Хеш-таблицы представляют собой распространенный  механизм для хранения пар ключ/элемент. Они обладают такими достоинствами, как универсальность  и простота, а также высокая эффективность при хорошо продуманной генерации хеш-кода. реализует интерфейс Dictionary. Он обладает определенной емкостью и средствами, определяющими момент увеличения таблицы. Расширение хеш-таблицы требует повторного хеширования всех ее элементов в соответствии с их новым положением в увеличенной таблице, так что важно обеспечить однократное изменение таблицы.

Другой фактор, влияющий на эффективность хеш-таблицы, — процесс генерации хеш- кода по ключу. Конфликты хеш-кодов должны происходить как можно реже. Хеш-коды обязаны равномерно распределяться по диапазону возможных значений, который для класса Hashtable совпадает с полным диапазоном типа int. Если различные ключи часто приводят к одним и тем же хеш-кодам, то некоторая часть хеш-таблицы быстро переполнится, в результате чего пострадает эффективность.

Значение хеш-кода возвращается методом hashCode для объекта, являющегося ключом. По умолчанию каждый объект имеет уникальный хеш-код. Использование в качестве ключей случайно выбранных объектов приводит к порождению различных хеш-кодов. Классы String, BitSet и большинство других, переопределяющих  метод equal, обычно переопределяют и hashCode. Это важно, поскольку класс Hashtable использует хеш-код

для нахождения набора ключей, которые могут совпадать с заданным, и вызывает equal для каждого из таких объектов, пока не будет найден совпадающий. Если для некоторых объектов equal и hashCode окажутся несовместимыми, то при использовании объектов этого типа в качестве ключей Hastable их поведение окажется непредсказуемым.

Пример использования класса Hastable приведен в классе Attributed Impl (см. раздел “Реализация интерфейсов”), в котором объект Hashtable использован для хранения атрибутов объекта. В этом примере ключами являются строковые объекты, представляющие собой имена атрибутов, а объекты Attr были значениями атрибутов.

Кроме методов, входящих в класс Dictionary (get, put, remove, size, isEmpty, keys и

elements), Hastable содержит следующие методы:

public synchronized boolean containsKey(Object key)

Возвращает true, если хеш-таблица содержит элемент с заданным ключом. public synchronized boolean contains(Object element)

Возвращает true, если заданный element является элементом хеш-таблицы. Данная операция является более сложной, чем метод containsKey, поскольку хеш-таблица

спроектирована с расчетом на эффективный поиск ключей, а не элементов. public synchronized void clear()

Делает хеш-таблицу пустой.

public synchronized Object clone()

Создает дубликат хеш-таблицы. Ключи и элементы при этом не дублируются.

Объекты Hashtable автоматически увеличиваются, когда они становятся слишком заполненными. Под выражением “слишком заполненными” понимается превышение показателя загрузки таблицы, который представляет собой отношение количества элементов к текущей емкости таблицы. Когда таблица увеличивается, ее новая емкость примерно вдвое превышает текущую. Для повышения эффективности следует выбирать емкость, представленную простым числом, чтобы при увеличении объекта Hastable также было выбрано ближайшее простое число. Исходная емкость хеш-таблицы и показатель загрузки могут задаваться в конструкторах Hashtable:

public Hashtable()

Конструирует новую, пустую хеш-таблицу с принятой по умолчанию исходной емкостью и показателем загрузки, равным 0, 75.

public Hashtable(int initialCapacity)

Конструирует новую, пустую хеш-таблицу с заданной емкостью initial Capacity и принятым по умолчанию показателем загрузки, равным 0,75.

public Hashtable(int initialCapacity, float loadFactor)

Конструирует новую, пустую хеш-таблицу с заданной емкостью и показателем загрузки loadFactor, который представляет собой число, лежащее в диапазоне 0,0–1,0 и определяющее момент увеличения хеш-таблицы. Если количество элементов хеш- таблицы превышает текущую емкость, умноженную на показатель загрузки, то хеш- таблица автоматически увеличивается.

Емкость по умолчанию выбирается “разумной”, причем критерий разумности зависит от реализации. После конструирования  объекта Hashtable невозможно изменить показатель загрузки или явно задать новую емкость.

При увеличении объекта Hashtable повторное хеширование осуществляется методом rehash. Метод rehash является защищенным, так что расширенные классы могут вызывать его по своему усмотрению, когда они решат, что наступило время увеличить емкость таблицы. Задать новый размер при этом невозможно — он всегда вычисляется методом rehash.

При реализации метод Hashtable.toString  возвращает строку, которая полностью описывает содержимое таблицы, включая результаты вызова to String для всех ключей и элементов, входящих в нее.

Упражнение 12.3

В классе WhichChars, имеется проблема с пометкой символов в верхней части диапазона Unicode, поскольку высокие значения символов оставляют много неиспользованных  битов в нижней части диапазона. Решите эту проблему с помощью класса Hashtable, сохраняя объект Character для каждого обнаруженного символа. Не забудьте написать свой класс- перечисление.

Упражнение 12.4

Теперь воспользуйтесь  классом Hashtable, чтобы сохранять объект BitSet для каждого нового старшего байта (старшие 8 бит), встречающегося во входной строке, причем каждый BitSet должен содержать младшие байты вместе с данным старшим байтом. Не забудьте написать свой класс-перечисление.

Упражнение 12.5

Напишите программу, которая пользуется объектом StreamTokenizer для разбиения входного файла на слова и подсчета количества слов в файле, с выводом результата.

Источник: Арнольд К., Гослинг Д. – Язык программирования Java (1997)

По теме:

  • Комментарии