集合与映射

最新推荐文章于 2025-09-13 14:06:01 发布

原创最新推荐文章于 2025-09-13 14:06:01 发布 · 821 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

数据结构

本文探讨了集合和映射这两种数据结构。在集合方面，通过对比基于BST和链表的实现，指出二分搜索树实现的集合在性能上更优。而在映射的实现中，同样发现二分搜索树的效率高于链表。文章分析了两种数据结构在不同情况下的时间复杂度，强调了满二分搜索树时的最佳性能。

一、集合

1、集合的应用

集合可以用来去重
集合可以用于进行客户的统计
集合可以用于文本词汇量的统计

2、集合的实现

（1）对于集合的一些定义，我们一般也都了解，例如集合一般都不会存放重复的元素，因此这就让它有了去重的功用了。

public interface Set<E> {

    void add(E e);//不能添加重复元素
    boolean contains(E e);
    void remove(E e);
    int getSize();
    boolean isEmpty();

}

（2）集合基于BST的实现

package com.zfy.setandmap;

import com.zfy.bst.BST;

/*
 * 这里是基于之前的二分搜索树实现的，
 * 1.因为集合具有去重的功用，说明它是可以有比较的功能的，所以这里实现了Comparable类，
 * 2.因为集合是可以存各种的数据类型，因此这里设计为泛型
 * */
public class BSTSet<E extends Comparable<E>> implements Set<E> {

    private BST<E> bst;
    
    //所有的BSTSet都是基于BST的
    public BSTSet() {
        bst = new BST<>();
    }
    
    @Override
    public void add(E e) {
        bst.add(e);
    }

    @Override
    public boolean contains(E e) {
        return bst.contains(e);
    }

    @Override
    public void remove(E e) {
        bst.remove(e);
    }

    @Override
    public int getSize() {
        return bst.getSize();
    }

    @Override
    public boolean isEmpty() {
        return bst.isEmpty();
    }       
}

（3）用链表作为集合的底层实现

public class LinkedListSet<E> implements Set<E> {

    private LinkedList<E> list;

    // 构造函数
    public LinkedListSet() {
        list = new LinkedList<>();
    }

    // 实现getSize方法
    @Override
    public int getSize() {
        return list.getSize();
    }

    // 实现isEmpty方法
    @Override
    public boolean isEmpty() {
        return list.isEmpty();
    }

    // 实现contains方法
    @Override
    public boolean contains(E e) {
        return list.contains(e);
    }

    // 实现add方法
    @Override
    public void add(E e) {
        if (!list.contains(e)) {
            list.addFirst(e);
        }
    }

    // 实现remove方法
    @Override
    public void remove(E e) {
        list.removeElement(e);
    }

（4）用二分搜索树实现的集合与用链表实现的集合的性能比较

import java.util.ArrayList;

public class Main {

    public static double testSet(Set<String> set, String filename) {

        long startTime = System.nanoTime();

        System.out.println(filename);
        ArrayList<String> words = new ArrayList<>();
        if (FileOperation.readFile(filename, words)) {
            System.out.println("Total words: " + words.size());

            for (String word : words) {
                set.add(word);
            }
            System.out.println("Total different words: " + set.getSize());
        }

        long endTime = System.nanoTime();

        return (endTime - startTime) / 1000000000.0;
    }

    public static void main(String[] args) {
        String filename = "pride-and-prejudice.txt";

        BSTSet<String> bstSet = new BSTSet<>();
        double time1 = testSet(bstSet, filename);
        System.out.println("BSTSet, time: " + time1 + " s");

        System.out.println();

        LinkedListSet<String> linkedListSet = new LinkedListSet<>();
        double time2 = testSet(linkedListSet, filename);
        System.out.println("LinkedListSet, time: " + time2 + " s");
    }
}

输出结果：

pride-and-prejudice.txt
Total words: 125901
Total different words: 6530
BSTSet, time: 0.109504342 s

pride-and-prejudice.txt
Total words: 125901
Total different words: 6530
LinkedListSet, time: 2.208894105 s

通过比较结果，我们发现，用二分搜索树实现的集合的比用链表实现的集合更加高效。

（5）集合的时间复杂度分析

上图中"h"是二分搜索树的高度
当二分搜索树"满"的时候，性能是最佳的，时间复杂度为O(logn)；当二分搜索树退化为链表的时候，性能是最差的，时间复杂度为O(n

二、映射（Map）

映射是存储（键，值）数据对的数据结构（Key, Value）
根据键（Key），寻找值（Value）

1、定义映射的接口

package com.zfy.setandmap;

public interface Map<K, V> {

    void add(K key, V value);
    V remove(K key);
    boolean contains(K key);
    V get(K key);
    void set(K key, V newValue);
    int getSize();
    boolean isEmpty();

}

2、Map的实现，基于BST的实现

package com.zfy.setandmap;

/*
 * 因为这里是基于二分搜索树实现的，所以这里的K是需要可比较的，因此实现了Comparable
 * */
public class BSTMap<K extends Comparable<K>, V> implements Map<K, V> {

    private class Node {
        public K key;
        public V value;
        public Node left, right;

        public Node(K key, V value) {
            this.key = key;
            this.value = value;
            left = null;
            right = null;
        }
    }

    private Node root;
    private int size;

    public BSTMap() {
        root = null;
        size = 0;
    }

    // 向二分搜索树中添加新的元素(key, value)
    @Override
    public void add(K key, V value) {
        root = add(root, key, value);
    }

    // 向以node为根的二分搜索树中插入元素(key, value)，递归算法
    // 返回插入新节点后二分搜索树的根
    private Node add(Node node, K key, V value) {

        if (node == null) {
            size++;
            return new Node(key, value);
        }

        if (key.compareTo(node.key) < 0) {
            node.left = add(node.left, key, value);
        } else if (key.compareTo(node.key) > 0) {
            node.right = add(node.right, key, value);
        } else // key.compareTo(node.key) == 0
            node.value = value;

        return node;
    }

    // 返回以node为根节点的二分搜索树中，key所在的节点
    @SuppressWarnings("unused")
    private Node getNode(Node node, K key) {
        if (node == null) {
            return null;
        }

        if (key.compareTo(node.key) < 0) {
            return getNode(node.left, key);
        } else if (key.compareTo(node.key) > 0) {
            return getNode(node.right, key);
        } else {
            return node;
        }
    }

    @Override
    public boolean contains(K key) {
        return getNode(root, key) != null;
    }

    @Override
    public V get(K key) {
        Node node = getNode(root, key);
        return node == null ? null : node.value;
    }

    @Override
    public void set(K key, V newValue) {
        Node node = getNode(root, key);
        if (node == null)
            throw new IllegalArgumentException(key + " doesn't exist!");

        node.value = newValue;
    }

    @Override
    public int getSize() {
        return size;
    }

    @Override
    public boolean isEmpty() {
        return size == 0;
    }

    // 从二分搜索树中删除键为key的节点
    @Override
    public V remove(K key) {

        Node node = getNode(root, key);
        if (node != null) {
            root = remove(root, key);
            return node.value;
        }
        return null;
    }

    private Node remove(Node node, K key) {

        if (node == null)
            return null;

        if (key.compareTo(node.key) < 0) {
            node.left = remove(node.left, key);
            return node;
        } else if (key.compareTo(node.key) > 0) {
            node.right = remove(node.right, key);
            return node;
        } else { // key.compareTo(node.key) == 0

            // 待删除节点左子树为空的情况
            if (node.left == null) {
                Node rightNode = node.right;
                node.right = null;
                size--;
                return rightNode;
            }

            // 待删除节点右子树为空的情况
            if (node.right == null) {
                Node leftNode = node.left;
                node.left = null;
                size--;
                return leftNode;
            }

            // 待删除节点左右子树均不为空的情况

            // 找到比待删除节点大的最小节点, 即待删除节点右子树的最小节点
            // 用这个节点顶替待删除节点的位置
            Node successor = minimum(node.right);
            successor.right = removeMin(node.right);
            successor.left = node.left;

            node.left = node.right = null;

            return successor;
        }
    }

    // 返回以node为根的二分搜索树的最小值所在的节点
    private Node minimum(Node node) {
        if (node.left == null)
            return node;
        return minimum(node.left);
    }

    // 删除掉以node为根的二分搜索树中的最小节点
    // 返回删除节点后新的二分搜索树的根
    private Node removeMin(Node node) {

        if (node.left == null) {
            Node rightNode = node.right;// 如果当前这个最小节点还有有孩子，那么先将它保存
            node.right = null;
            size--;
            return rightNode;
        }
        node.left = removeMin(node.left);
        return node;
    }

}

3、基于链表实现的Map

package com.zfy.setandmap;

public class LinkedListMap<K, V> implements Map<K, V> {
    
    /*
     * 因为前面的链表只能承载一个元素e，因此对于这里的映射类，我们需要重新重新实现Node了
     * */
    private class Node{
        public K key;
        public V value;
        public Node next;

        public Node(K key, V value, Node next){
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public Node(K key, V value){
            this(key, value, null);
        }

        public Node(){
            this(null, null, null);
        }

        @Override
        public String toString(){
            return key.toString() + " : " + value.toString();
        }
    }


    private Node dummyHead;
    private int size;

    public LinkedListMap(){
        dummyHead = new Node();
        size = 0;
    }
    
    //传来一个k的值，返回这个k所对应的节点的引用，后面的增删改查都将借助于这个方法
    private Node getNode(K key){
        Node cur = dummyHead.next;//cur对应dummyHead的next节点，就是第一个元素
        //循环遍历判断cur是否包含传入的key，如果包含则返回cur，否则继续遍历
        while (cur != null) {
            if (cur.equals(key)) {
                return cur;
            }
            cur = cur.next;
        }
        return null;
    }
    
    @Override
    public void add(K key, V value) {
        Node node = getNode(key);//首先调用这个方法，然后判断返回后的当前节点中是否包含添加所传入的key键所对应的数据，如果没有则添加，有则覆盖
        if (node == null) {
            dummyHead.next = new Node(key, value, dummyHead.next);
            size ++;
        }else {
            node.value = value;
        }
    }

    //此方法发与之前的类似
    @Override
    public V remove(K key) {
        Node prev = dummyHead;
        while (prev.next != null) {
            if (prev.next.key.equals(key)) {
                break;
            }
            prev = prev.next;
        }
        if (prev != null) {
            Node delNode = prev.next;
            prev.next = delNode.next;
            delNode.next = null;
            size --;
            return delNode.value;
        }
        return null;
    }

    @Override
    public boolean contains(K key) {
        return getNode(key) != null;
    }

    @Override
    public V get(K key) {
        Node node = getNode(key);//先调用getNode，返回所对应的节点，然后对其进行判断
        return node == null ? null :node.value;
    }

    @Override
    public void set(K key, V newValue) {
        Node node = getNode(key);
        if (node == null) {
            throw new IllegalArgumentException(key + " doesn't exist!");
        }else {
            node.value = newValue;
        }
    }

    @Override
    public int getSize() {
        return size;
    }

    @Override
    public boolean isEmpty() {
        return size == 0;
    }

}

4、用二分搜索树实现的映射与用链表实现的映射的性能比较

import java.util.ArrayList;

public class Main {

    public static double testMap(Map<String, Integer> map, String filename) {

        long startTime = System.nanoTime();

        System.out.println(filename);
        ArrayList<String> words = new ArrayList<>();
        if (FileOperation.readFile(filename, words)) {
            System.out.println("Total words: " + words.size());
            for (String word : words) {
                if (map.contains(word)) {
                    map.set(word, map.get(word) + 1);
                } else {
                    map.add(word, 1);
                }
            }

            System.out.println("Total different words: " + map.getSize());
            System.out.println("Frequency of PRIDE: " + map.get("pride"));
            System.out.println("Frequency of PREJUDICE: " + map.get("prejudice"));
        }

        long endTime = System.nanoTime();

        return (endTime - startTime) / 1000000000.0;
    }

    public static void main(String[] args) {

        String filename = "pride-and-prejudice.txt";

        LinkedListMap<String, Integer> linkedListMap = new LinkedListMap<>();
        double time1 = testMap(linkedListMap, filename);
        System.out.println("Linked List Map, time: " + time1 + " s");

        System.out.println();
        System.out.println();

        BSTMap<String, Integer> bstMap = new BSTMap<>();
        double time2 = testMap(bstMap, filename);
        System.out.println("BST Map, time: " + time2 + " s");

    }
}

输出结果：

pride-and-prejudice.txt
Total words: 125901
Total different words: 6530
Frequency of PRIDE: 53
Frequency of PREJUDICE: 11
Linked List Map, time: 9.692566895 s


pride-and-prejudice.txt
Total words: 125901
Total different words: 6530
Frequency of PRIDE: 53
Frequency of PREJUDICE: 11
BST Map, time: 0.085364242 s

通过比较结果，我们发现，用二分搜索树实现的映射的比用链表实现的映射更加高效。

4、映射的时间复杂度