数据结构与算法
链表

链表的一个应用案例。LRU(Least Recently Used, 最近最少使用)缓存淘汰的总体思路:缓存的key放到链表中,头部的元素表示最近刚使用。
- 如果命中缓存,从链表中找到对应的key,移到链表头部。
- 如果没命中缓存:
- 如果缓存容量没超,放入缓存,并把key放到链表头部。
- 如果超出缓存容量,删除链表尾部元素,再把key放到链表头部。

ring的应用:基于滑动窗口的统计。比如最近100次接口调用的平均耗时、最近10笔订单的平均值、最近30个交易日股票的最高点。ring的容量即为滑动窗口的大小,把待观察变量按时间顺序不停地写入ring即可。
Go
package main
import (
"container/ring"
"fmt"
)
func TraverseRing(ring *ring.Ring) {
ring.Do(func(i interface{}) { //通过Do()来遍历ring,内部实际上调用了Next()而非Prev()
fmt.Printf("%v ", i)
})
fmt.Println()
}
func main() {
ring := ring.New(5) //必须指定长度,各元素被初始化为nil
ring2 := ring.Prev()
for i := 0; i < 3; i++ {
ring.Value = i
ring = ring.Next()
}
for i := 0; i < 3; i++ {
ring2.Value = i
ring2 = ring2.Prev()
}
TraverseRing(ring)
TraverseRing(ring2) //ring和ring2当前所在的指针位置不同,所以遍历出来的顺序也不同
}
栈
栈是一种先进后出的数据结构,push把元素压入栈底,pop弹出栈顶的元素。编程语言的编译系统也用到了栈的思想。

go自带的List已经包含了栈的功能,这里实现一个线程安全的栈。
Go
type (
node struct {
value interface{}
prev *node
}
MyStack struct {
top *node
length int
lock *sync.RWMutex
}
)
func NewMyStack() *MyStack {
return &MyStack{nil, 0, &sync.RWMutex{}}
}
func (stack *MyStack) Push(value interface{}) {
stack.lock.Lock()
defer stack.lock.Unlock()
n := &node{value, stack.top}
stack.top = n
stack.length++
}
func (stack *MyStack) Pop() interface{} {
stack.lock.Lock()
defer stack.lock.Unlock()
if stack.length == 0 {
return nil
}
n := stack.top
stack.top = n.prev
stack.length--
return n.value
}
func (stack *MyStack) Peak() interface{} {
stack.lock.RLock()
defer stack.lock.RUnlock()
if stack.length == 0 {
return nil
}
return stack.top.value
}
func (stack *MyStack) Len() int {
return stack.length
}
func (stack *MyStack) Empty() bool {
return stack.Len() == 0
}
堆
堆是一棵二叉树。大根堆即任意节点的值都大于等于其子节点。反之为小根堆。
用数组来表示堆,下标为 i 的结点的父结点下标为(i-1)/2,其左右子结点分别为 (2i + 1)、(2i + 2)。

构建堆

Go
package main
import "fmt"
//AdjustTraingle 如果只是修改slice里的元素,不需要传slice的指针;如果要往slice里append或让slice指向新的子切片,则需要传slice指针
func AdjustTraingle(arr []int, parent int) {
left := 2*parent + 1
if left >= len(arr) {
return
}
right := 2*parent + 2
minIndex := parent
minValue := arr[minIndex]
if arr[left] < minValue {
minValue = arr[left]
minIndex = left
}
if right < len(arr) {
if arr[right] < minValue {
minValue = arr[right]
minIndex = right
}
}
if minIndex != parent {
arr[minIndex], arr[parent] = arr[parent], arr[minIndex]
AdjustTraingle(arr, minIndex) //递归。每当有元素调整下来时,要对以它为父节点的三角形区域进行调整
}
}
func ReverseAdjust(arr []int) {
n := len(arr)
if n <= 1 {
return
}
lastIndex := n / 2 * 2
fmt.Println(lastIndex)
for i := lastIndex; i > 0; i -= 2 { //逆序检查每一个三角形区域
right := i
parent := (right - 1) / 2
fmt.Println(parent)
AdjustTraingle(arr, parent)
}
}
func buildHeap() {
arr := []int{62, 40, 20, 30, 15, 10, 49}
ReverseAdjust(arr)
fmt.Println(arr)
}
每当有元素调整下来时,要对以它为父节点的三角形区域进行调整。
插入元素

删除堆顶

下面讲几个堆的应用。
堆排序
- 构建堆O(N)。
- 不断地删除堆顶O(NlogN)。
求集合中最大的K个元素
- 用集合的前K个元素构建小根堆。
- 逐一遍历集合的其他元素,如果比堆顶小直接丢弃;否则替换掉堆顶,然后向下调整堆。
把超时的元素从缓存中删除
- 按key的到期时间把key插入小根堆中。
- 周期扫描堆顶元素,如果它的到期时间早于当前时刻,则从堆和缓存中删除,然后向下调整堆。 golang中的container/heap实现了小根堆,但需要自己定义一个类,实现以下接口:
- Len() int
- Less(i, j int) bool
- Swap(i, j int)
- Push(x interface{})
- Pop() x interface{}
Go
type Item struct {
Value string
priority int //优先级,数字越大,优先级越高
}
type PriorityQueue []*Item
func (pq PriorityQueue) Len() int {
return len(pq)
}
func (pq PriorityQueue) Less(i, j int) bool {
return pq[i].priority > pq[j].priority //golang默认提供的是小根堆,而优先队列是大根堆,所以这里要反着定义Less
}
func (pq PriorityQueue) Swap(i, j int) {
pq[i], pq[j] = pq[j], pq[i]
}
//往slice里append,需要传slice指针
func (pq *PriorityQueue) Push(x interface{}) {
item := x.(*Item)
*pq = append(*pq, item)
}
//让slice指向新的子切片,需要传slice指针
func (pq *PriorityQueue) Pop() interface{} {
old := *pq
n := len(old)
item := old[n-1] //数组最后一个元素
*pq = old[0 : n-1] //去掉最一个元素
return item
}
Trie树
trie树又叫字典权。
现有term集合:{分散,分散精力,分散投资,分布式,工程,工程师},把它们放到Trie树里如下图:

Trie树的根节点是总入口,不存储字符。对于英文,第个节点有26个子节点,子节点可以存到数组里;中文由于汉字很多,用数组存子节点太浪费内存,可以用map存子节点。从根节点到叶节点的完整路径是一个term。从根节点到某个中间节点也可能是一个term,即一个term可能是另一个term的前缀。上图中红圈表示从根节点到本节点是一个完整的term。
Go
package main
import "fmt"
type TrieNode struct {
Word rune //当前节点存储的字符。byte只能表示英文字符,rune可以表示任意字符
Children map[rune]*TrieNode //孩子节点,用一个map存储
Term string
}
type TrieTree struct {
root *TrieNode
}
//add 把words[beginIndex:]插入到Trie树中
func (node *TrieNode) add(words []rune, term string, beginIndex int) {
if beginIndex >= len(words) { //words已经遍历完了
node.Term = term
return
}
if node.Children == nil {
node.Children = make(map[rune]*TrieNode)
}
word := words[beginIndex] //把这个word放到node的子节点中
if child, exists := node.Children[word]; !exists {
newNode := &TrieNode{Word: word}
node.Children[word] = newNode
newNode.add(words, term, beginIndex+1) //递归
} else {
child.add(words, term, beginIndex+1) //递归
}
}
//walk words[0]就是当前节点上存储的字符,按照words的指引顺着树往下走,最终返回words最后一个字符对应的节点
func (node *TrieNode) walk(words []rune, beginIndex int) *TrieNode {
if beginIndex == len(words)-1 {
return node
}
beginIndex += 1
word := words[beginIndex]
if child, exists := node.Children[word]; exists {
return child.walk(words, beginIndex)
} else {
return nil
}
}
//traverseTerms 遍历一个node下面所有的term。注意要传数组的指针,才能真正修改这个数组
func (node *TrieNode) traverseTerms(terms *[]string) {
if len(node.Term) > 0 {
*terms = append(*terms, node.Term)
}
for _, child := range node.Children {
child.traverseTerms(terms)
}
}
func (tree *TrieTree) AddTerm(term string) {
if len(term) <= 1 {
return
}
words := []rune(term)
if tree.root == nil {
tree.root = new(TrieNode)
}
tree.root.add(words, term, 0)
}
func (tree *TrieTree) Retrieve(prefix string) []string {
if tree.root == nil || len(tree.root.Children) == 0 {
return nil
}
words := []rune(prefix)
firstWord := words[0]
if child, exists := tree.root.Children[firstWord]; exists {
end := child.walk(words, 0)
if end == nil {
return nil
} else {
terms := make([]string, 0, 100)
end.traverseTerms(&terms)
return terms
}
} else {
return nil
}
}
func main() {
tree := new(TrieTree)
tree.AddTerm("分散")
tree.AddTerm("分散精力")
tree.AddTerm("分散投资")
tree.AddTerm("分布式")
tree.AddTerm("工程")
tree.AddTerm("工程师")
terms := tree.Retrieve("分散")
fmt.Println(terms)
terms = tree.Retrieve("人工")
fmt.Println(terms)
}