Hui-s-notebook/logseq-java/journals/2022_09_13.md at 0e31c0d985c41fefa41a0bddeccbdc77148aad8e

lostecho/Hui-s-notebook

Fork 0

Files

Lostecho c7947017c3 add logseq-java

2024-02-02 00:12:49 +08:00

7.7 KiB

Raw Blame History

索引的概念
- 用于提高查找速度的一种数据结构
为什么要用B+树，B-树和B+树区别，为什么不用红黑树
- Hash表结构存储数据
  - 通过key的hash计算得到存储下表
  - Hash只能进行等值查询，切换速度非常快，但是无法用于范围查询
- 二叉查找树
  - 左边小，右边大，自身带排序
  - 二分查找
  - 极端情况
    - 根节点的选取，如果选取不好就会不平衡
    - 出现某一个方向子树过长
- 平衡二叉树
  - 改善二叉树极端情况
  - 降低IO次数，每走一个节点进行一次IO
  - 数的高度过高，IO性能下降
- B树
  - 存放指针及数据，保存了排序功能
  - 指定阶数M，一个节点包含的子节点最大数量M越大，高度越低
  - 范围查询大的时候需要返回根节点再次便利
  - 存储了data信息，记录增多的时候树的高度会变高
- B+树
  - 数据全部存在子节点中，非子节点只存储键值和指针
  - 子节点之间添加链表结构，解决范围查询时需要返回根节点
  - 范围查询效率提高很多，单个查询比B+树提高不大
那些情况适合建立索引，那些不适合建立索引
- 频繁使用where
- 分组字段，分组的前提为排序
- 统计字段
  - 加了索引不需要产生中间表去重
- 频繁更新字段
- 数据单一固定
- 数据量大(数据类型text)
- where条件不怎么用的
索引分类，最左前缀，聚簇索引
- 主键索引
- 唯一索引(一级索引)
- 普通索引(二级索引)
- 联合索引(需要符合最左前缀原则)
- 最左前缀
  - 第一个值为从小到大排序，第二个不是
  - 第一个值确定的情况下，第二个值是有序的
  - 从最左边开始连续的索引都可以匹配上，直到遇到范围查询，> < between
  - 已经排序好的字段是会生效的，
    - a=1 and b>1 ab都会生效
    - a>1 and b=1 b索引会失效，a>1 时b为无序的
- MyISAM和InnoDB数据结构
  - MYD数据 MYI索引
  - ibd数据和索引，读一个文件速度更快
- 聚簇索引
  - 根据主键索引可以直接拿到数据，索引和数据放在一起
  - InnoDB
    - 定义主键为聚簇索引
    - 未定义索引，选择第一个部位null唯一索引
    - 以上都没用，使用一个6字节长整型的隐式字段ROWID字段构建聚簇索引，该RPWID字段会在插入新行时自动递增
- 非聚簇索引(辅助索引)
  - 除聚簇索引外
  - 只存储主键ID
  - 查询可能需要回表，通过辅助索引查询得到ID去主键索引中查找
  - MyISAM中通过主键查询得到数据在硬盘中的地址，再根据该地址去磁盘中寻找
  - 主键索引唯一，辅助索引可能等值也会查询出多个数据
- 索引覆盖
  - 通过辅助索引可以获得全部数据，不需要回表
- 索引失效
  - select *
  - %左边
  - 未最左匹配
  - 数据库认为不要
  - 计算
  - or
  - ！= > <
- 优化
  - 辅助索引覆盖
  - 自增主键ID
  - 避免select *
  - 少用子查询，能使用外连接就外连接，避免笛卡尔积
  - 使用短索引，非叶子节点存储更多索引降低树的高度
- 为什么推荐使用自增主键作为索引
  - 页分裂
  - 降低复杂度
List集合
- 结合源码，回答核心流程，夹带关键字
- ArrayList
  - 如何扩容，大小如何自动增加
    - 1. 初始化，未给定长度，默认调用午餐构造器
      - elementdata 常量数组为空
      - new之后数组长度为0
    - 1. 添加第一个元素
      - 计算容量，比较长度后返回初始化长度为10
    - 1. 数组扩容
      - grow方法增加长度
      - 新容量为老容量加上老容量右移以为，即1.5倍
      - 掉用复制数组的方法
- 复制某个ArrayList到另一个里面去
  - clong，addAll，copy，stream流
  - 重写Clone方法
  - 浅复制
    - 返回一个一样的ArrayList，其中一个改变了元素，另一个也会改变
    - 两个集合中存储同一份元素引用
  - 深复制
    - 重写clone方法，使用迭代器便利，重新创建引用对象，逐个添加
- 索引中ArrayList增加或删除某个元素的运行过程，效率很低吗
  - 效率很低，添加或删除某个元素都需要对数组中的元素进行移位，需要不断进行ArrayCopy很浪费时间
  - 添加，后面元素都后移一位，再添加
  - 删除，后面元素都前移一位覆盖
- 很大的数组需要拷贝，如何快速拷贝
  - 创建时就指定数组的大小
- 获得线程安全的ArrayList
  - synchorizoned关键字
- LinkedList和ArrayList如何选择
  - ArrayList底层为数组，查询效率高，增删效率低
  - LinkedList底层为链表，查询效率低，增删效率高
- Vector
  - 扩容为2倍，线程安全
Set
- HashSet
  - 无序，去重，非线程安全
  - new新建HashMap
  - 底层通过HashMap的key值实现的，值为常量PRESENT(一个空的Object对象)
    - put调用setValue方法
  - 添加时为什么要给个value为PRESENT常量
    - PRESENT决定返回oldValue还是null判断是否已经存在
  - HashSet remove方法比较PRESENT
    - HashMap的删除方法成功会返回value，失败返回null，通过返回判断是否删除
  - 去重原理
    - hashcode和equals方法
    - 先判断hash值，再通过==和wquals判断，返回true则为重复元素
  - HashSet和TreeSet
    - 无序HashSet，有序TreeSet
  - 如何得到一个线程安全的Set集合
    - Collections.synchorizeonedSet()
HashMap的底层结构
- jdk1.7 数组+单向链表
- jdk1.8 数组+链表(单向/双向)+红黑树
- 内部定义静态Node类
  - Node<K, V>
  - TreeNode有TreeNode left，TreeNode right继承LinkedHashMap.Entry继承HashMap.Node
- 如何解决Hash碰撞
  - 存放元素需要通过Hash计算来得到Hash值，Hash值为元素要存放的位置，当两个不同元素经过Hash计算得到的Hash值相同，两个元素要存放在同一个位置，产生冲突
  - HashMap的put方法
    - 初始化table数组长度为16，第一次添加table为null，通过resize()方法,给新容量16，阈值16*0.75
    - threadhold，扩容因子0.75
- 何时从单链表转化为红黑树
  - 常量TREEIFY_THREADHOLD = 8 通过treeify()方法重组为红黑二叉树
- 扩容方法
  - 通过resize方法扩容，判断是否达到阈值，达到就扩容为原来的两倍
  - 数组长度小于临界值MIN_TREEIFY_64或等于null时
- 何时扩容
  - 转红黑树时要判断，转换时需要搬运元素，第一个元素要扩容
  - 添加一个元素后
- HashMap设置长度为11，那么数组容量为多少
  - tbaleSizeFor()方法重组
  - hash计算更加平均，与数组长度值有关
  - 设置为大于我们自定义的值的第一个2的幂次方的值，设置为11长度为16
- HashMap何时从红黑树转化为单链表模式
  - 扩容时需要搬运数据，如果红黑二叉树不需要转化条件就会转化为链表
  - resize()方法转移红黑二叉树时会调用splite()方法
  - lohead，hihead，分割时会产生高位树和低位树，小于等于6时调用untreeify方法退回链表结构
- 多线程并发使用时，容易造成死循环/死锁
  - 非线程安全
  - jdk1.7头插法，jdk1.8尾插法
- ConcurrentHashMap
  - 线程安全的集合
  - ConcurrentHashMap在jdk1.7和1.8的区别
    - jdk1.7 Segment段数组+Entry数组+单链表
      - Segment继承ReenTrantLock类，每一个segment相当于一个锁，这就是分段锁
      - 当其它线程进行put操作时，发现锁资源被占用时回去进行节点创建避免线程空闲，这种思想也叫预创建
      - segment长度固定为16，HashEntry可以扩容
    - jdk1.8 和HashMap结构一样
    - CAS + setCtl
  - 如何保证线程安全
  - key和value不支持null的原因
    - 二义性

7.7 KiB Raw Blame History Unescape Escape

7.7 KiB

Raw Blame History