[算法] 找兄弟单词
题目:一个单词单词字母交换,可得另一个单词,如army->mary,成为兄弟单词。提供一个单词,在字典中找到它的兄弟。描述数据结构和查询过程。
使用hash_map和链表
定义key, 使得兄弟单词有相同的key, 不是兄弟的单词有不同的key
两种方式:
- 将单词按字母从小到大重新排序后作为其key, 比如bad的key为abd,good的key为dgoo
- 将每一个字母对应一个质数, 然后让对应的质数相乘, 将得到的值进行hash, 这样兄弟单词的值就是一样的了, 并且不同单词的质数相乘积肯定不同
创建hash_map的时间复杂度为O(n), 查找兄弟单词的时间复杂度是O(1).
如果是海量词典的话, 可以用B+树.
下面是简单用于测试两个单词是否是兄弟的代码.
prime_l = [
2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41,
43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101,
103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167,
173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239
]
def prime_match(str1, str2):
if len(str1) != len(str2):
return False
p1 = p2 = 1
for s in str1:
index = (ord(s) - ord('a') + 26) if s > 'Z' else (ord(s) - ord('A'))
p1 *= prime_l[index]
for s in str2:
index = (ord(s) - ord('a') + 26) if s > 'Z' else (ord(s) - ord('A'))
p2 *= prime_l[index]
return p1 == p2
def sorted_match(str1, str2):
if len(str1) != len(str2):
return False
return sorted(str1) == sorted(str2)
print(prime_match('bad', 'abD'), sorted_match('bad', 'abD'))
print(prime_match('army', 'mary'), sorted_match('army', 'mary'))
print(prime_match('army', 'maryb'), sorted_match('army', 'maryb'))
相关文章:
兄弟单词 — 两种算法实现 用C++语言实现的. 利用了Trie数来节省空间. 数据少的情况下没啥用.