- Update Xen patches to 3.3-rc5 and c/s 1157.
[linux-flexiantxendom0-3.2.10.git] / drivers / pci / probe.c
1 /*
2  * probe.c - PCI detection and setup code
3  */
4
5 #include <linux/kernel.h>
6 #include <linux/delay.h>
7 #include <linux/init.h>
8 #include <linux/pci.h>
9 #include <linux/slab.h>
10 #include <linux/module.h>
11 #include <linux/cpumask.h>
12 #include <linux/pci-aspm.h>
13 #include "pci.h"
14
15 #define CARDBUS_LATENCY_TIMER   176     /* secondary latency timer */
16 #define CARDBUS_RESERVE_BUSNR   3
17
18 /* Ugh.  Need to stop exporting this to modules. */
19 LIST_HEAD(pci_root_buses);
20 EXPORT_SYMBOL(pci_root_buses);
21
22
23 static int find_anything(struct device *dev, void *data)
24 {
25         return 1;
26 }
27
28 /*
29  * Some device drivers need know if pci is initiated.
30  * Basically, we think pci is not initiated when there
31  * is no device to be found on the pci_bus_type.
32  */
33 int no_pci_devices(void)
34 {
35         struct device *dev;
36         int no_devices;
37
38         dev = bus_find_device(&pci_bus_type, NULL, NULL, find_anything);
39         no_devices = (dev == NULL);
40         put_device(dev);
41         return no_devices;
42 }
43 EXPORT_SYMBOL(no_pci_devices);
44
45 /*
46  * PCI Bus Class
47  */
48 static void release_pcibus_dev(struct device *dev)
49 {
50         struct pci_bus *pci_bus = to_pci_bus(dev);
51
52         if (pci_bus->bridge)
53                 put_device(pci_bus->bridge);
54         pci_bus_remove_resources(pci_bus);
55         pci_release_bus_of_node(pci_bus);
56         kfree(pci_bus);
57 }
58
59 static struct class pcibus_class = {
60         .name           = "pci_bus",
61         .dev_release    = &release_pcibus_dev,
62         .dev_attrs      = pcibus_dev_attrs,
63 };
64
65 static int __init pcibus_class_init(void)
66 {
67         return class_register(&pcibus_class);
68 }
69 postcore_initcall(pcibus_class_init);
70
71 static u64 pci_size(u64 base, u64 maxbase, u64 mask)
72 {
73         u64 size = mask & maxbase;      /* Find the significant bits */
74         if (!size)
75                 return 0;
76
77         /* Get the lowest of them to find the decode size, and
78            from that the extent.  */
79         size = (size & ~(size-1)) - 1;
80
81         /* base == maxbase can be valid only if the BAR has
82            already been programmed with all 1s.  */
83         if (base == maxbase && ((base | size) & mask) != mask)
84                 return 0;
85
86         return size;
87 }
88
89 static inline unsigned long decode_bar(struct pci_dev *dev, u32 bar)
90 {
91         u32 mem_type;
92         unsigned long flags;
93
94         if ((bar & PCI_BASE_ADDRESS_SPACE) == PCI_BASE_ADDRESS_SPACE_IO) {
95                 flags = bar & ~PCI_BASE_ADDRESS_IO_MASK;
96                 flags |= IORESOURCE_IO;
97                 return flags;
98         }
99
100         flags = bar & ~PCI_BASE_ADDRESS_MEM_MASK;
101         flags |= IORESOURCE_MEM;
102         if (flags & PCI_BASE_ADDRESS_MEM_PREFETCH)
103                 flags |= IORESOURCE_PREFETCH;
104
105         mem_type = bar & PCI_BASE_ADDRESS_MEM_TYPE_MASK;
106         switch (mem_type) {
107         case PCI_BASE_ADDRESS_MEM_TYPE_32:
108                 break;
109         case PCI_BASE_ADDRESS_MEM_TYPE_1M:
110                 dev_info(&dev->dev, "1M mem BAR treated as 32-bit BAR\n");
111                 break;
112         case PCI_BASE_ADDRESS_MEM_TYPE_64:
113                 flags |= IORESOURCE_MEM_64;
114                 break;
115         default:
116                 dev_warn(&dev->dev,
117                          "mem unknown type %x treated as 32-bit BAR\n",
118                          mem_type);
119                 break;
120         }
121         return flags;
122 }
123
124 /**
125  * pci_read_base - read a PCI BAR
126  * @dev: the PCI device
127  * @type: type of the BAR
128  * @res: resource buffer to be filled in
129  * @pos: BAR position in the config space
130  *
131  * Returns 1 if the BAR is 64-bit, or 0 if 32-bit.
132  */
133 int __pci_read_base(struct pci_dev *dev, enum pci_bar_type type,
134                         struct resource *res, unsigned int pos)
135 {
136         u32 l, sz, mask;
137         u16 orig_cmd;
138
139         mask = type ? PCI_ROM_ADDRESS_MASK : ~0;
140
141         if (!dev->mmio_always_on) {
142                 pci_read_config_word(dev, PCI_COMMAND, &orig_cmd);
143                 pci_write_config_word(dev, PCI_COMMAND,
144                         orig_cmd & ~(PCI_COMMAND_MEMORY | PCI_COMMAND_IO));
145         }
146
147         res->name = pci_name(dev);
148
149         pci_read_config_dword(dev, pos, &l);
150         pci_write_config_dword(dev, pos, l | mask);
151         pci_read_config_dword(dev, pos, &sz);
152         pci_write_config_dword(dev, pos, l);
153
154         if (!dev->mmio_always_on)
155                 pci_write_config_word(dev, PCI_COMMAND, orig_cmd);
156
157         /*
158          * All bits set in sz means the device isn't working properly.
159          * If the BAR isn't implemented, all bits must be 0.  If it's a
160          * memory BAR or a ROM, bit 0 must be clear; if it's an io BAR, bit
161          * 1 must be clear.
162          */
163         if (!sz || sz == 0xffffffff)
164                 goto fail;
165
166         /*
167          * I don't know how l can have all bits set.  Copied from old code.
168          * Maybe it fixes a bug on some ancient platform.
169          */
170         if (l == 0xffffffff)
171                 l = 0;
172
173         if (type == pci_bar_unknown) {
174                 res->flags = decode_bar(dev, l);
175                 res->flags |= IORESOURCE_SIZEALIGN;
176                 if (res->flags & IORESOURCE_IO) {
177                         l &= PCI_BASE_ADDRESS_IO_MASK;
178                         mask = PCI_BASE_ADDRESS_IO_MASK & (u32) IO_SPACE_LIMIT;
179                 } else {
180                         l &= PCI_BASE_ADDRESS_MEM_MASK;
181                         mask = (u32)PCI_BASE_ADDRESS_MEM_MASK;
182                 }
183         } else {
184                 res->flags |= (l & IORESOURCE_ROM_ENABLE);
185                 l &= PCI_ROM_ADDRESS_MASK;
186                 mask = (u32)PCI_ROM_ADDRESS_MASK;
187         }
188
189         if (res->flags & IORESOURCE_MEM_64) {
190                 u64 l64 = l;
191                 u64 sz64 = sz;
192                 u64 mask64 = mask | (u64)~0 << 32;
193
194                 pci_read_config_dword(dev, pos + 4, &l);
195                 pci_write_config_dword(dev, pos + 4, ~0);
196                 pci_read_config_dword(dev, pos + 4, &sz);
197                 pci_write_config_dword(dev, pos + 4, l);
198
199                 l64 |= ((u64)l << 32);
200                 sz64 |= ((u64)sz << 32);
201
202                 sz64 = pci_size(l64, sz64, mask64);
203
204                 if (!sz64)
205                         goto fail;
206
207                 if ((sizeof(resource_size_t) < 8) && (sz64 > 0x100000000ULL)) {
208                         dev_err(&dev->dev, "reg %x: can't handle 64-bit BAR\n",
209                                 pos);
210                         goto fail;
211                 }
212
213                 if ((sizeof(resource_size_t) < 8) && l) {
214                         /* Address above 32-bit boundary; disable the BAR */
215                         pci_write_config_dword(dev, pos, 0);
216                         pci_write_config_dword(dev, pos + 4, 0);
217                         res->start = 0;
218                         res->end = sz64;
219                 } else {
220                         res->start = l64;
221                         res->end = l64 + sz64;
222                         dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n",
223                                    pos, res);
224                 }
225         } else {
226                 sz = pci_size(l, sz, mask);
227
228                 if (!sz)
229                         goto fail;
230
231                 res->start = l;
232                 res->end = l + sz;
233
234                 dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n", pos, res);
235         }
236
237  out:
238         return (res->flags & IORESOURCE_MEM_64) ? 1 : 0;
239  fail:
240         res->flags = 0;
241         goto out;
242 }
243
244 static void pci_read_bases(struct pci_dev *dev, unsigned int howmany, int rom)
245 {
246         unsigned int pos, reg;
247
248         for (pos = 0; pos < howmany; pos++) {
249                 struct resource *res = &dev->resource[pos];
250                 reg = PCI_BASE_ADDRESS_0 + (pos << 2);
251                 pos += __pci_read_base(dev, pci_bar_unknown, res, reg);
252         }
253
254         if (rom) {
255                 struct resource *res = &dev->resource[PCI_ROM_RESOURCE];
256                 dev->rom_base_reg = rom;
257                 res->flags = IORESOURCE_MEM | IORESOURCE_PREFETCH |
258                                 IORESOURCE_READONLY | IORESOURCE_CACHEABLE |
259                                 IORESOURCE_SIZEALIGN;
260                 __pci_read_base(dev, pci_bar_mem32, res, rom);
261         }
262 }
263
264 static void __devinit pci_read_bridge_io(struct pci_bus *child)
265 {
266         struct pci_dev *dev = child->self;
267         u8 io_base_lo, io_limit_lo;
268         unsigned long base, limit;
269         struct resource *res;
270
271         res = child->resource[0];
272         pci_read_config_byte(dev, PCI_IO_BASE, &io_base_lo);
273         pci_read_config_byte(dev, PCI_IO_LIMIT, &io_limit_lo);
274         base = (io_base_lo & PCI_IO_RANGE_MASK) << 8;
275         limit = (io_limit_lo & PCI_IO_RANGE_MASK) << 8;
276
277         if ((io_base_lo & PCI_IO_RANGE_TYPE_MASK) == PCI_IO_RANGE_TYPE_32) {
278                 u16 io_base_hi, io_limit_hi;
279                 pci_read_config_word(dev, PCI_IO_BASE_UPPER16, &io_base_hi);
280                 pci_read_config_word(dev, PCI_IO_LIMIT_UPPER16, &io_limit_hi);
281                 base |= (io_base_hi << 16);
282                 limit |= (io_limit_hi << 16);
283         }
284
285         if (base && base <= limit) {
286                 res->flags = (io_base_lo & PCI_IO_RANGE_TYPE_MASK) | IORESOURCE_IO;
287                 if (!res->start)
288                         res->start = base;
289                 if (!res->end)
290                         res->end = limit + 0xfff;
291                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
292         }
293 }
294
295 static void __devinit pci_read_bridge_mmio(struct pci_bus *child)
296 {
297         struct pci_dev *dev = child->self;
298         u16 mem_base_lo, mem_limit_lo;
299         unsigned long base, limit;
300         struct resource *res;
301
302         res = child->resource[1];
303         pci_read_config_word(dev, PCI_MEMORY_BASE, &mem_base_lo);
304         pci_read_config_word(dev, PCI_MEMORY_LIMIT, &mem_limit_lo);
305         base = (mem_base_lo & PCI_MEMORY_RANGE_MASK) << 16;
306         limit = (mem_limit_lo & PCI_MEMORY_RANGE_MASK) << 16;
307         if (base && base <= limit) {
308                 res->flags = (mem_base_lo & PCI_MEMORY_RANGE_TYPE_MASK) | IORESOURCE_MEM;
309                 res->start = base;
310                 res->end = limit + 0xfffff;
311                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
312         }
313 }
314
315 static void __devinit pci_read_bridge_mmio_pref(struct pci_bus *child)
316 {
317         struct pci_dev *dev = child->self;
318         u16 mem_base_lo, mem_limit_lo;
319         unsigned long base, limit;
320         struct resource *res;
321
322         res = child->resource[2];
323         pci_read_config_word(dev, PCI_PREF_MEMORY_BASE, &mem_base_lo);
324         pci_read_config_word(dev, PCI_PREF_MEMORY_LIMIT, &mem_limit_lo);
325         base = (mem_base_lo & PCI_PREF_RANGE_MASK) << 16;
326         limit = (mem_limit_lo & PCI_PREF_RANGE_MASK) << 16;
327
328         if ((mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) == PCI_PREF_RANGE_TYPE_64) {
329                 u32 mem_base_hi, mem_limit_hi;
330                 pci_read_config_dword(dev, PCI_PREF_BASE_UPPER32, &mem_base_hi);
331                 pci_read_config_dword(dev, PCI_PREF_LIMIT_UPPER32, &mem_limit_hi);
332
333                 /*
334                  * Some bridges set the base > limit by default, and some
335                  * (broken) BIOSes do not initialize them.  If we find
336                  * this, just assume they are not being used.
337                  */
338                 if (mem_base_hi <= mem_limit_hi) {
339 #if BITS_PER_LONG == 64
340                         base |= ((long) mem_base_hi) << 32;
341                         limit |= ((long) mem_limit_hi) << 32;
342 #else
343                         if (mem_base_hi || mem_limit_hi) {
344                                 dev_err(&dev->dev, "can't handle 64-bit "
345                                         "address space for bridge\n");
346                                 return;
347                         }
348 #endif
349                 }
350         }
351         if (base && base <= limit) {
352                 res->flags = (mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) |
353                                          IORESOURCE_MEM | IORESOURCE_PREFETCH;
354                 if (res->flags & PCI_PREF_RANGE_TYPE_64)
355                         res->flags |= IORESOURCE_MEM_64;
356                 res->start = base;
357                 res->end = limit + 0xfffff;
358                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
359         }
360 }
361
362 void __devinit pci_read_bridge_bases(struct pci_bus *child)
363 {
364         struct pci_dev *dev = child->self;
365         struct resource *res;
366         int i;
367
368         if (pci_is_root_bus(child))     /* It's a host bus, nothing to read */
369                 return;
370
371         dev_info(&dev->dev, "PCI bridge to [bus %02x-%02x]%s\n",
372                  child->secondary, child->subordinate,
373                  dev->transparent ? " (subtractive decode)" : "");
374
375         pci_bus_remove_resources(child);
376         for (i = 0; i < PCI_BRIDGE_RESOURCE_NUM; i++)
377                 child->resource[i] = &dev->resource[PCI_BRIDGE_RESOURCES+i];
378
379         pci_read_bridge_io(child);
380         pci_read_bridge_mmio(child);
381         pci_read_bridge_mmio_pref(child);
382
383         if (dev->transparent) {
384                 pci_bus_for_each_resource(child->parent, res, i) {
385                         if (res) {
386                                 pci_bus_add_resource(child, res,
387                                                      PCI_SUBTRACTIVE_DECODE);
388                                 dev_printk(KERN_DEBUG, &dev->dev,
389                                            "  bridge window %pR (subtractive decode)\n",
390                                            res);
391                         }
392                 }
393         }
394 }
395
396 static struct pci_bus * pci_alloc_bus(void)
397 {
398         struct pci_bus *b;
399
400         b = kzalloc(sizeof(*b), GFP_KERNEL);
401         if (b) {
402                 INIT_LIST_HEAD(&b->node);
403                 INIT_LIST_HEAD(&b->children);
404                 INIT_LIST_HEAD(&b->devices);
405                 INIT_LIST_HEAD(&b->slots);
406                 INIT_LIST_HEAD(&b->resources);
407                 b->max_bus_speed = PCI_SPEED_UNKNOWN;
408                 b->cur_bus_speed = PCI_SPEED_UNKNOWN;
409         }
410         return b;
411 }
412
413 static unsigned char pcix_bus_speed[] = {
414         PCI_SPEED_UNKNOWN,              /* 0 */
415         PCI_SPEED_66MHz_PCIX,           /* 1 */
416         PCI_SPEED_100MHz_PCIX,          /* 2 */
417         PCI_SPEED_133MHz_PCIX,          /* 3 */
418         PCI_SPEED_UNKNOWN,              /* 4 */
419         PCI_SPEED_66MHz_PCIX_ECC,       /* 5 */
420         PCI_SPEED_100MHz_PCIX_ECC,      /* 6 */
421         PCI_SPEED_133MHz_PCIX_ECC,      /* 7 */
422         PCI_SPEED_UNKNOWN,              /* 8 */
423         PCI_SPEED_66MHz_PCIX_266,       /* 9 */
424         PCI_SPEED_100MHz_PCIX_266,      /* A */
425         PCI_SPEED_133MHz_PCIX_266,      /* B */
426         PCI_SPEED_UNKNOWN,              /* C */
427         PCI_SPEED_66MHz_PCIX_533,       /* D */
428         PCI_SPEED_100MHz_PCIX_533,      /* E */
429         PCI_SPEED_133MHz_PCIX_533       /* F */
430 };
431
432 static unsigned char pcie_link_speed[] = {
433         PCI_SPEED_UNKNOWN,              /* 0 */
434         PCIE_SPEED_2_5GT,               /* 1 */
435         PCIE_SPEED_5_0GT,               /* 2 */
436         PCIE_SPEED_8_0GT,               /* 3 */
437         PCI_SPEED_UNKNOWN,              /* 4 */
438         PCI_SPEED_UNKNOWN,              /* 5 */
439         PCI_SPEED_UNKNOWN,              /* 6 */
440         PCI_SPEED_UNKNOWN,              /* 7 */
441         PCI_SPEED_UNKNOWN,              /* 8 */
442         PCI_SPEED_UNKNOWN,              /* 9 */
443         PCI_SPEED_UNKNOWN,              /* A */
444         PCI_SPEED_UNKNOWN,              /* B */
445         PCI_SPEED_UNKNOWN,              /* C */
446         PCI_SPEED_UNKNOWN,              /* D */
447         PCI_SPEED_UNKNOWN,              /* E */
448         PCI_SPEED_UNKNOWN               /* F */
449 };
450
451 void pcie_update_link_speed(struct pci_bus *bus, u16 linksta)
452 {
453         bus->cur_bus_speed = pcie_link_speed[linksta & 0xf];
454 }
455 EXPORT_SYMBOL_GPL(pcie_update_link_speed);
456
457 static unsigned char agp_speeds[] = {
458         AGP_UNKNOWN,
459         AGP_1X,
460         AGP_2X,
461         AGP_4X,
462         AGP_8X
463 };
464
465 static enum pci_bus_speed agp_speed(int agp3, int agpstat)
466 {
467         int index = 0;
468
469         if (agpstat & 4)
470                 index = 3;
471         else if (agpstat & 2)
472                 index = 2;
473         else if (agpstat & 1)
474                 index = 1;
475         else
476                 goto out;
477         
478         if (agp3) {
479                 index += 2;
480                 if (index == 5)
481                         index = 0;
482         }
483
484  out:
485         return agp_speeds[index];
486 }
487
488
489 static void pci_set_bus_speed(struct pci_bus *bus)
490 {
491         struct pci_dev *bridge = bus->self;
492         int pos;
493
494         pos = pci_find_capability(bridge, PCI_CAP_ID_AGP);
495         if (!pos)
496                 pos = pci_find_capability(bridge, PCI_CAP_ID_AGP3);
497         if (pos) {
498                 u32 agpstat, agpcmd;
499
500                 pci_read_config_dword(bridge, pos + PCI_AGP_STATUS, &agpstat);
501                 bus->max_bus_speed = agp_speed(agpstat & 8, agpstat & 7);
502
503                 pci_read_config_dword(bridge, pos + PCI_AGP_COMMAND, &agpcmd);
504                 bus->cur_bus_speed = agp_speed(agpstat & 8, agpcmd & 7);
505         }
506
507         pos = pci_find_capability(bridge, PCI_CAP_ID_PCIX);
508         if (pos) {
509                 u16 status;
510                 enum pci_bus_speed max;
511                 pci_read_config_word(bridge, pos + 2, &status);
512
513                 if (status & 0x8000) {
514                         max = PCI_SPEED_133MHz_PCIX_533;
515                 } else if (status & 0x4000) {
516                         max = PCI_SPEED_133MHz_PCIX_266;
517                 } else if (status & 0x0002) {
518                         if (((status >> 12) & 0x3) == 2) {
519                                 max = PCI_SPEED_133MHz_PCIX_ECC;
520                         } else {
521                                 max = PCI_SPEED_133MHz_PCIX;
522                         }
523                 } else {
524                         max = PCI_SPEED_66MHz_PCIX;
525                 }
526
527                 bus->max_bus_speed = max;
528                 bus->cur_bus_speed = pcix_bus_speed[(status >> 6) & 0xf];
529
530                 return;
531         }
532
533         pos = pci_find_capability(bridge, PCI_CAP_ID_EXP);
534         if (pos) {
535                 u32 linkcap;
536                 u16 linksta;
537
538                 pci_read_config_dword(bridge, pos + PCI_EXP_LNKCAP, &linkcap);
539                 bus->max_bus_speed = pcie_link_speed[linkcap & 0xf];
540
541                 pci_read_config_word(bridge, pos + PCI_EXP_LNKSTA, &linksta);
542                 pcie_update_link_speed(bus, linksta);
543         }
544 }
545
546
547 static struct pci_bus *pci_alloc_child_bus(struct pci_bus *parent,
548                                            struct pci_dev *bridge, int busnr)
549 {
550         struct pci_bus *child;
551         int i;
552
553         /*
554          * Allocate a new bus, and inherit stuff from the parent..
555          */
556         child = pci_alloc_bus();
557         if (!child)
558                 return NULL;
559
560         child->parent = parent;
561         child->ops = parent->ops;
562         child->sysdata = parent->sysdata;
563         child->bus_flags = parent->bus_flags;
564
565         /* initialize some portions of the bus device, but don't register it
566          * now as the parent is not properly set up yet.  This device will get
567          * registered later in pci_bus_add_devices()
568          */
569         child->dev.class = &pcibus_class;
570         dev_set_name(&child->dev, "%04x:%02x", pci_domain_nr(child), busnr);
571
572         /*
573          * Set up the primary, secondary and subordinate
574          * bus numbers.
575          */
576         child->number = child->secondary = busnr;
577         child->primary = parent->secondary;
578         child->subordinate = 0xff;
579
580         if (!bridge)
581                 return child;
582
583         child->self = bridge;
584         child->bridge = get_device(&bridge->dev);
585         pci_set_bus_of_node(child);
586         pci_set_bus_speed(child);
587
588         /* Set up default resource pointers and names.. */
589         for (i = 0; i < PCI_BRIDGE_RESOURCE_NUM; i++) {
590                 child->resource[i] = &bridge->resource[PCI_BRIDGE_RESOURCES+i];
591                 child->resource[i]->name = child->name;
592         }
593         bridge->subordinate = child;
594
595         return child;
596 }
597
598 struct pci_bus *__ref pci_add_new_bus(struct pci_bus *parent, struct pci_dev *dev, int busnr)
599 {
600         struct pci_bus *child;
601
602         child = pci_alloc_child_bus(parent, dev, busnr);
603         if (child) {
604                 down_write(&pci_bus_sem);
605                 list_add_tail(&child->node, &parent->children);
606                 up_write(&pci_bus_sem);
607         }
608         return child;
609 }
610
611 static void pci_fixup_parent_subordinate_busnr(struct pci_bus *child, int max)
612 {
613         struct pci_bus *parent = child->parent;
614
615         /* Attempts to fix that up are really dangerous unless
616            we're going to re-assign all bus numbers. */
617         if (!pcibios_assign_all_busses())
618                 return;
619
620         while (parent->parent && parent->subordinate < max) {
621                 parent->subordinate = max;
622                 pci_write_config_byte(parent->self, PCI_SUBORDINATE_BUS, max);
623                 parent = parent->parent;
624         }
625 }
626
627 /*
628  * If it's a bridge, configure it and scan the bus behind it.
629  * For CardBus bridges, we don't scan behind as the devices will
630  * be handled by the bridge driver itself.
631  *
632  * We need to process bridges in two passes -- first we scan those
633  * already configured by the BIOS and after we are done with all of
634  * them, we proceed to assigning numbers to the remaining buses in
635  * order to avoid overlaps between old and new bus numbers.
636  */
637 int __devinit pci_scan_bridge(struct pci_bus *bus, struct pci_dev *dev, int max, int pass)
638 {
639         struct pci_bus *child;
640         int is_cardbus = (dev->hdr_type == PCI_HEADER_TYPE_CARDBUS);
641         u32 buses, i, j = 0;
642         u16 bctl;
643         u8 primary, secondary, subordinate;
644         int broken = 0;
645
646         pci_read_config_dword(dev, PCI_PRIMARY_BUS, &buses);
647         primary = buses & 0xFF;
648         secondary = (buses >> 8) & 0xFF;
649         subordinate = (buses >> 16) & 0xFF;
650
651         dev_dbg(&dev->dev, "scanning [bus %02x-%02x] behind bridge, pass %d\n",
652                 secondary, subordinate, pass);
653
654         if (!primary && (primary != bus->number) && secondary && subordinate) {
655                 dev_warn(&dev->dev, "Primary bus is hard wired to 0\n");
656                 primary = bus->number;
657         }
658
659         /* Check if setup is sensible at all */
660         if (!pass &&
661             (primary != bus->number || secondary <= bus->number)) {
662                 dev_dbg(&dev->dev, "bus configuration invalid, reconfiguring\n");
663                 broken = 1;
664         }
665
666         /* Disable MasterAbortMode during probing to avoid reporting
667            of bus errors (in some architectures) */ 
668         pci_read_config_word(dev, PCI_BRIDGE_CONTROL, &bctl);
669         pci_write_config_word(dev, PCI_BRIDGE_CONTROL,
670                               bctl & ~PCI_BRIDGE_CTL_MASTER_ABORT);
671
672         if ((secondary || subordinate) && !pcibios_assign_all_busses() &&
673             !is_cardbus && !broken) {
674                 unsigned int cmax;
675                 /*
676                  * Bus already configured by firmware, process it in the first
677                  * pass and just note the configuration.
678                  */
679                 if (pass)
680                         goto out;
681
682                 /*
683                  * If we already got to this bus through a different bridge,
684                  * don't re-add it. This can happen with the i450NX chipset.
685                  *
686                  * However, we continue to descend down the hierarchy and
687                  * scan remaining child buses.
688                  */
689                 child = pci_find_bus(pci_domain_nr(bus), secondary);
690                 if (!child) {
691                         child = pci_add_new_bus(bus, dev, secondary);
692                         if (!child)
693                                 goto out;
694                         child->primary = primary;
695                         child->subordinate = subordinate;
696                         child->bridge_ctl = bctl;
697                 }
698
699                 cmax = pci_scan_child_bus(child);
700                 if (cmax > max)
701                         max = cmax;
702                 if (child->subordinate > max)
703                         max = child->subordinate;
704         } else {
705                 /*
706                  * We need to assign a number to this bus which we always
707                  * do in the second pass.
708                  */
709                 if (!pass) {
710                         if (pcibios_assign_all_busses() || broken)
711                                 /* Temporarily disable forwarding of the
712                                    configuration cycles on all bridges in
713                                    this bus segment to avoid possible
714                                    conflicts in the second pass between two
715                                    bridges programmed with overlapping
716                                    bus ranges. */
717                                 pci_write_config_dword(dev, PCI_PRIMARY_BUS,
718                                                        buses & ~0xffffff);
719                         goto out;
720                 }
721
722                 /* Clear errors */
723                 pci_write_config_word(dev, PCI_STATUS, 0xffff);
724
725                 /* Prevent assigning a bus number that already exists.
726                  * This can happen when a bridge is hot-plugged, so in
727                  * this case we only re-scan this bus. */
728                 child = pci_find_bus(pci_domain_nr(bus), max+1);
729                 if (!child) {
730                         child = pci_add_new_bus(bus, dev, ++max);
731                         if (!child)
732                                 goto out;
733                 }
734                 buses = (buses & 0xff000000)
735                       | ((unsigned int)(child->primary)     <<  0)
736                       | ((unsigned int)(child->secondary)   <<  8)
737                       | ((unsigned int)(child->subordinate) << 16);
738
739                 /*
740                  * yenta.c forces a secondary latency timer of 176.
741                  * Copy that behaviour here.
742                  */
743                 if (is_cardbus) {
744                         buses &= ~0xff000000;
745                         buses |= CARDBUS_LATENCY_TIMER << 24;
746                 }
747
748                 /*
749                  * We need to blast all three values with a single write.
750                  */
751                 pci_write_config_dword(dev, PCI_PRIMARY_BUS, buses);
752
753                 if (!is_cardbus) {
754                         child->bridge_ctl = bctl;
755                         /*
756                          * Adjust subordinate busnr in parent buses.
757                          * We do this before scanning for children because
758                          * some devices may not be detected if the bios
759                          * was lazy.
760                          */
761                         pci_fixup_parent_subordinate_busnr(child, max);
762                         /* Now we can scan all subordinate buses... */
763                         max = pci_scan_child_bus(child);
764                         /*
765                          * now fix it up again since we have found
766                          * the real value of max.
767                          */
768                         pci_fixup_parent_subordinate_busnr(child, max);
769                 } else {
770                         /*
771                          * For CardBus bridges, we leave 4 bus numbers
772                          * as cards with a PCI-to-PCI bridge can be
773                          * inserted later.
774                          */
775                         for (i=0; i<CARDBUS_RESERVE_BUSNR; i++) {
776                                 struct pci_bus *parent = bus;
777                                 if (pci_find_bus(pci_domain_nr(bus),
778                                                         max+i+1))
779                                         break;
780                                 while (parent->parent) {
781                                         if ((!pcibios_assign_all_busses()) &&
782                                             (parent->subordinate > max) &&
783                                             (parent->subordinate <= max+i)) {
784                                                 j = 1;
785                                         }
786                                         parent = parent->parent;
787                                 }
788                                 if (j) {
789                                         /*
790                                          * Often, there are two cardbus bridges
791                                          * -- try to leave one valid bus number
792                                          * for each one.
793                                          */
794                                         i /= 2;
795                                         break;
796                                 }
797                         }
798                         max += i;
799                         pci_fixup_parent_subordinate_busnr(child, max);
800                 }
801                 /*
802                  * Set the subordinate bus number to its real value.
803                  */
804                 child->subordinate = max;
805                 pci_write_config_byte(dev, PCI_SUBORDINATE_BUS, max);
806         }
807
808         sprintf(child->name,
809                 (is_cardbus ? "PCI CardBus %04x:%02x" : "PCI Bus %04x:%02x"),
810                 pci_domain_nr(bus), child->number);
811
812         /* Has only triggered on CardBus, fixup is in yenta_socket */
813         while (bus->parent) {
814                 if ((child->subordinate > bus->subordinate) ||
815                     (child->number > bus->subordinate) ||
816                     (child->number < bus->number) ||
817                     (child->subordinate < bus->number)) {
818                         dev_info(&child->dev, "[bus %02x-%02x] %s "
819                                 "hidden behind%s bridge %s [bus %02x-%02x]\n",
820                                 child->number, child->subordinate,
821                                 (bus->number > child->subordinate &&
822                                  bus->subordinate < child->number) ?
823                                         "wholly" : "partially",
824                                 bus->self->transparent ? " transparent" : "",
825                                 dev_name(&bus->dev),
826                                 bus->number, bus->subordinate);
827                 }
828                 bus = bus->parent;
829         }
830
831 out:
832         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, bctl);
833
834         return max;
835 }
836
837 /*
838  * Read interrupt line and base address registers.
839  * The architecture-dependent code can tweak these, of course.
840  */
841 static void pci_read_irq(struct pci_dev *dev)
842 {
843         unsigned char irq;
844
845         pci_read_config_byte(dev, PCI_INTERRUPT_PIN, &irq);
846         dev->pin = irq;
847         if (irq)
848                 pci_read_config_byte(dev, PCI_INTERRUPT_LINE, &irq);
849         dev->irq = irq;
850 }
851
852 void set_pcie_port_type(struct pci_dev *pdev)
853 {
854         int pos;
855         u16 reg16;
856
857         pos = pci_find_capability(pdev, PCI_CAP_ID_EXP);
858         if (!pos)
859                 return;
860         pdev->is_pcie = 1;
861         pdev->pcie_cap = pos;
862         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
863         pdev->pcie_type = (reg16 & PCI_EXP_FLAGS_TYPE) >> 4;
864         pci_read_config_word(pdev, pos + PCI_EXP_DEVCAP, &reg16);
865         pdev->pcie_mpss = reg16 & PCI_EXP_DEVCAP_PAYLOAD;
866 }
867
868 void set_pcie_hotplug_bridge(struct pci_dev *pdev)
869 {
870         int pos;
871         u16 reg16;
872         u32 reg32;
873
874         pos = pci_pcie_cap(pdev);
875         if (!pos)
876                 return;
877         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
878         if (!(reg16 & PCI_EXP_FLAGS_SLOT))
879                 return;
880         pci_read_config_dword(pdev, pos + PCI_EXP_SLTCAP, &reg32);
881         if (reg32 & PCI_EXP_SLTCAP_HPC)
882                 pdev->is_hotplug_bridge = 1;
883 }
884
885 #define LEGACY_IO_RESOURCE      (IORESOURCE_IO | IORESOURCE_PCI_FIXED)
886
887 /**
888  * pci_setup_device - fill in class and map information of a device
889  * @dev: the device structure to fill
890  *
891  * Initialize the device structure with information about the device's 
892  * vendor,class,memory and IO-space addresses,IRQ lines etc.
893  * Called at initialisation of the PCI subsystem and by CardBus services.
894  * Returns 0 on success and negative if unknown type of device (not normal,
895  * bridge or CardBus).
896  */
897 int pci_setup_device(struct pci_dev *dev)
898 {
899         u32 class;
900         u8 hdr_type;
901         struct pci_slot *slot;
902         int pos = 0;
903
904         if (pci_read_config_byte(dev, PCI_HEADER_TYPE, &hdr_type))
905                 return -EIO;
906
907         dev->sysdata = dev->bus->sysdata;
908         dev->dev.parent = dev->bus->bridge;
909         dev->dev.bus = &pci_bus_type;
910         dev->hdr_type = hdr_type & 0x7f;
911         dev->multifunction = !!(hdr_type & 0x80);
912         dev->error_state = pci_channel_io_normal;
913         set_pcie_port_type(dev);
914
915         list_for_each_entry(slot, &dev->bus->slots, list)
916                 if (PCI_SLOT(dev->devfn) == slot->number)
917                         dev->slot = slot;
918
919         /* Assume 32-bit PCI; let 64-bit PCI cards (which are far rarer)
920            set this higher, assuming the system even supports it.  */
921         dev->dma_mask = 0xffffffff;
922
923         dev_set_name(&dev->dev, "%04x:%02x:%02x.%d", pci_domain_nr(dev->bus),
924                      dev->bus->number, PCI_SLOT(dev->devfn),
925                      PCI_FUNC(dev->devfn));
926
927         pci_read_config_dword(dev, PCI_CLASS_REVISION, &class);
928         dev->revision = class & 0xff;
929         class >>= 8;                                /* upper 3 bytes */
930         dev->class = class;
931         class >>= 8;
932
933         dev_printk(KERN_DEBUG, &dev->dev, "[%04x:%04x] type %d class %#08x\n",
934                    dev->vendor, dev->device, dev->hdr_type, class);
935
936         /* need to have dev->class ready */
937         dev->cfg_size = pci_cfg_space_size(dev);
938
939         /* "Unknown power state" */
940         dev->current_state = PCI_UNKNOWN;
941
942         /* Early fixups, before probing the BARs */
943         pci_fixup_device(pci_fixup_early, dev);
944         /* device class may be changed after fixup */
945         class = dev->class >> 8;
946
947         switch (dev->hdr_type) {                    /* header type */
948         case PCI_HEADER_TYPE_NORMAL:                /* standard header */
949                 if (class == PCI_CLASS_BRIDGE_PCI)
950                         goto bad;
951                 pci_read_irq(dev);
952                 pci_read_bases(dev, 6, PCI_ROM_ADDRESS);
953                 pci_read_config_word(dev, PCI_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
954                 pci_read_config_word(dev, PCI_SUBSYSTEM_ID, &dev->subsystem_device);
955
956                 /*
957                  *      Do the ugly legacy mode stuff here rather than broken chip
958                  *      quirk code. Legacy mode ATA controllers have fixed
959                  *      addresses. These are not always echoed in BAR0-3, and
960                  *      BAR0-3 in a few cases contain junk!
961                  */
962                 if (class == PCI_CLASS_STORAGE_IDE) {
963                         u8 progif;
964                         pci_read_config_byte(dev, PCI_CLASS_PROG, &progif);
965                         if ((progif & 1) == 0) {
966                                 dev->resource[0].start = 0x1F0;
967                                 dev->resource[0].end = 0x1F7;
968                                 dev->resource[0].flags = LEGACY_IO_RESOURCE;
969                                 dev->resource[1].start = 0x3F6;
970                                 dev->resource[1].end = 0x3F6;
971                                 dev->resource[1].flags = LEGACY_IO_RESOURCE;
972                         }
973                         if ((progif & 4) == 0) {
974                                 dev->resource[2].start = 0x170;
975                                 dev->resource[2].end = 0x177;
976                                 dev->resource[2].flags = LEGACY_IO_RESOURCE;
977                                 dev->resource[3].start = 0x376;
978                                 dev->resource[3].end = 0x376;
979                                 dev->resource[3].flags = LEGACY_IO_RESOURCE;
980                         }
981                 }
982                 break;
983
984         case PCI_HEADER_TYPE_BRIDGE:                /* bridge header */
985                 if (class != PCI_CLASS_BRIDGE_PCI)
986                         goto bad;
987                 /* The PCI-to-PCI bridge spec requires that subtractive
988                    decoding (i.e. transparent) bridge must have programming
989                    interface code of 0x01. */ 
990                 pci_read_irq(dev);
991                 dev->transparent = ((dev->class & 0xff) == 1);
992                 pci_read_bases(dev, 2, PCI_ROM_ADDRESS1);
993                 set_pcie_hotplug_bridge(dev);
994                 pos = pci_find_capability(dev, PCI_CAP_ID_SSVID);
995                 if (pos) {
996                         pci_read_config_word(dev, pos + PCI_SSVID_VENDOR_ID, &dev->subsystem_vendor);
997                         pci_read_config_word(dev, pos + PCI_SSVID_DEVICE_ID, &dev->subsystem_device);
998                 }
999                 break;
1000
1001         case PCI_HEADER_TYPE_CARDBUS:               /* CardBus bridge header */
1002                 if (class != PCI_CLASS_BRIDGE_CARDBUS)
1003                         goto bad;
1004                 pci_read_irq(dev);
1005                 pci_read_bases(dev, 1, 0);
1006                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
1007                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_ID, &dev->subsystem_device);
1008                 break;
1009
1010         default:                                    /* unknown header */
1011                 dev_err(&dev->dev, "unknown header type %02x, "
1012                         "ignoring device\n", dev->hdr_type);
1013                 return -EIO;
1014
1015         bad:
1016                 dev_err(&dev->dev, "ignoring class %02x (doesn't match header "
1017                         "type %02x)\n", class, dev->hdr_type);
1018                 dev->class = PCI_CLASS_NOT_DEFINED;
1019         }
1020
1021         /* We found a fine healthy device, go go go... */
1022         return 0;
1023 }
1024
1025 static void pci_release_capabilities(struct pci_dev *dev)
1026 {
1027         pci_vpd_release(dev);
1028         pci_iov_release(dev);
1029 }
1030
1031 /**
1032  * pci_release_dev - free a pci device structure when all users of it are finished.
1033  * @dev: device that's been disconnected
1034  *
1035  * Will be called only by the device core when all users of this pci device are
1036  * done.
1037  */
1038 static void pci_release_dev(struct device *dev)
1039 {
1040         struct pci_dev *pci_dev;
1041
1042         pci_dev = to_pci_dev(dev);
1043         pci_release_capabilities(pci_dev);
1044         pci_release_of_node(pci_dev);
1045         kfree(pci_dev);
1046 }
1047
1048 /**
1049  * pci_cfg_space_size - get the configuration space size of the PCI device.
1050  * @dev: PCI device
1051  *
1052  * Regular PCI devices have 256 bytes, but PCI-X 2 and PCI Express devices
1053  * have 4096 bytes.  Even if the device is capable, that doesn't mean we can
1054  * access it.  Maybe we don't have a way to generate extended config space
1055  * accesses, or the device is behind a reverse Express bridge.  So we try
1056  * reading the dword at 0x100 which must either be 0 or a valid extended
1057  * capability header.
1058  */
1059 int pci_cfg_space_size_ext(struct pci_dev *dev)
1060 {
1061         u32 status;
1062         int pos = PCI_CFG_SPACE_SIZE;
1063
1064         if (pci_read_config_dword(dev, pos, &status) != PCIBIOS_SUCCESSFUL)
1065                 goto fail;
1066         if (status == 0xffffffff)
1067                 goto fail;
1068
1069         return PCI_CFG_SPACE_EXP_SIZE;
1070
1071  fail:
1072         return PCI_CFG_SPACE_SIZE;
1073 }
1074
1075 int pci_cfg_space_size(struct pci_dev *dev)
1076 {
1077         int pos;
1078         u32 status;
1079         u16 class;
1080
1081         class = dev->class >> 8;
1082         if (class == PCI_CLASS_BRIDGE_HOST)
1083                 return pci_cfg_space_size_ext(dev);
1084
1085         pos = pci_pcie_cap(dev);
1086         if (!pos) {
1087                 pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
1088                 if (!pos)
1089                         goto fail;
1090
1091                 pci_read_config_dword(dev, pos + PCI_X_STATUS, &status);
1092                 if (!(status & (PCI_X_STATUS_266MHZ | PCI_X_STATUS_533MHZ)))
1093                         goto fail;
1094         }
1095
1096         return pci_cfg_space_size_ext(dev);
1097
1098  fail:
1099         return PCI_CFG_SPACE_SIZE;
1100 }
1101
1102 static void pci_release_bus_bridge_dev(struct device *dev)
1103 {
1104         kfree(dev);
1105 }
1106
1107 struct pci_dev *alloc_pci_dev(void)
1108 {
1109         struct pci_dev *dev;
1110
1111         dev = kzalloc(sizeof(struct pci_dev), GFP_KERNEL);
1112         if (!dev)
1113                 return NULL;
1114
1115         INIT_LIST_HEAD(&dev->bus_list);
1116
1117         return dev;
1118 }
1119 EXPORT_SYMBOL(alloc_pci_dev);
1120
1121 /*
1122  * Read the config data for a PCI device, sanity-check it
1123  * and fill in the dev structure...
1124  */
1125 static struct pci_dev *pci_scan_device(struct pci_bus *bus, int devfn)
1126 {
1127         struct pci_dev *dev;
1128         u32 l;
1129         int delay = 1;
1130
1131         if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
1132                 return NULL;
1133
1134         /* some broken boards return 0 or ~0 if a slot is empty: */
1135         if (l == 0xffffffff || l == 0x00000000 ||
1136             l == 0x0000ffff || l == 0xffff0000)
1137                 return NULL;
1138
1139         /* Configuration request Retry Status */
1140         while (l == 0xffff0001) {
1141                 msleep(delay);
1142                 delay *= 2;
1143                 if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
1144                         return NULL;
1145                 /* Card hasn't responded in 60 seconds?  Must be stuck. */
1146                 if (delay > 60 * 1000) {
1147                         printk(KERN_WARNING "pci %04x:%02x:%02x.%d: not "
1148                                         "responding\n", pci_domain_nr(bus),
1149                                         bus->number, PCI_SLOT(devfn),
1150                                         PCI_FUNC(devfn));
1151                         return NULL;
1152                 }
1153         }
1154
1155         dev = alloc_pci_dev();
1156         if (!dev)
1157                 return NULL;
1158
1159         dev->bus = bus;
1160         dev->devfn = devfn;
1161         dev->vendor = l & 0xffff;
1162         dev->device = (l >> 16) & 0xffff;
1163
1164         pci_set_of_node(dev);
1165
1166         if (pci_setup_device(dev)) {
1167                 kfree(dev);
1168                 return NULL;
1169         }
1170
1171         return dev;
1172 }
1173
1174 static void pci_init_capabilities(struct pci_dev *dev)
1175 {
1176         /* MSI/MSI-X list */
1177         pci_msi_init_pci_dev(dev);
1178
1179         /* Buffers for saving PCIe and PCI-X capabilities */
1180         pci_allocate_cap_save_buffers(dev);
1181
1182         /* Power Management */
1183         pci_pm_init(dev);
1184         platform_pci_wakeup_init(dev);
1185
1186         /* Vital Product Data */
1187         pci_vpd_pci22_init(dev);
1188
1189 #ifdef CONFIG_XEN
1190         if (!is_initial_xendomain())
1191                 return;
1192 #endif
1193
1194         /* Alternative Routing-ID Forwarding */
1195         pci_enable_ari(dev);
1196
1197         /* Single Root I/O Virtualization */
1198         pci_iov_init(dev);
1199
1200         /* Enable ACS P2P upstream forwarding */
1201         pci_enable_acs(dev);
1202 }
1203
1204 void pci_device_add(struct pci_dev *dev, struct pci_bus *bus)
1205 {
1206         device_initialize(&dev->dev);
1207         dev->dev.release = pci_release_dev;
1208         pci_dev_get(dev);
1209
1210         dev->dev.dma_mask = &dev->dma_mask;
1211         dev->dev.dma_parms = &dev->dma_parms;
1212         dev->dev.coherent_dma_mask = 0xffffffffull;
1213
1214         pci_set_dma_max_seg_size(dev, 65536);
1215         pci_set_dma_seg_boundary(dev, 0xffffffff);
1216
1217         /* Fix up broken headers */
1218         pci_fixup_device(pci_fixup_header, dev);
1219
1220         /* Clear the state_saved flag. */
1221         dev->state_saved = false;
1222
1223         /* Initialize various capabilities */
1224         pci_init_capabilities(dev);
1225
1226         /*
1227          * Add the device to our list of discovered devices
1228          * and the bus list for fixup functions, etc.
1229          */
1230         down_write(&pci_bus_sem);
1231         list_add_tail(&dev->bus_list, &bus->devices);
1232         up_write(&pci_bus_sem);
1233 }
1234
1235 struct pci_dev *__ref pci_scan_single_device(struct pci_bus *bus, int devfn)
1236 {
1237         struct pci_dev *dev;
1238
1239         dev = pci_get_slot(bus, devfn);
1240         if (dev) {
1241                 pci_dev_put(dev);
1242                 return dev;
1243         }
1244
1245         dev = pci_scan_device(bus, devfn);
1246         if (!dev)
1247                 return NULL;
1248
1249         pci_device_add(dev, bus);
1250
1251         return dev;
1252 }
1253 EXPORT_SYMBOL(pci_scan_single_device);
1254
1255 static unsigned next_ari_fn(struct pci_dev *dev, unsigned fn)
1256 {
1257         u16 cap;
1258         unsigned pos, next_fn;
1259
1260         if (!dev)
1261                 return 0;
1262
1263         pos = pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ARI);
1264         if (!pos)
1265                 return 0;
1266         pci_read_config_word(dev, pos + 4, &cap);
1267         next_fn = cap >> 8;
1268         if (next_fn <= fn)
1269                 return 0;
1270         return next_fn;
1271 }
1272
1273 static unsigned next_trad_fn(struct pci_dev *dev, unsigned fn)
1274 {
1275         return (fn + 1) % 8;
1276 }
1277
1278 static unsigned no_next_fn(struct pci_dev *dev, unsigned fn)
1279 {
1280         return 0;
1281 }
1282
1283 static int only_one_child(struct pci_bus *bus)
1284 {
1285         struct pci_dev *parent = bus->self;
1286         if (!parent || !pci_is_pcie(parent))
1287                 return 0;
1288         if (parent->pcie_type == PCI_EXP_TYPE_ROOT_PORT ||
1289             parent->pcie_type == PCI_EXP_TYPE_DOWNSTREAM)
1290                 return 1;
1291         return 0;
1292 }
1293
1294 /**
1295  * pci_scan_slot - scan a PCI slot on a bus for devices.
1296  * @bus: PCI bus to scan
1297  * @devfn: slot number to scan (must have zero function.)
1298  *
1299  * Scan a PCI slot on the specified PCI bus for devices, adding
1300  * discovered devices to the @bus->devices list.  New devices
1301  * will not have is_added set.
1302  *
1303  * Returns the number of new devices found.
1304  */
1305 int pci_scan_slot(struct pci_bus *bus, int devfn)
1306 {
1307         unsigned fn, nr = 0;
1308         struct pci_dev *dev;
1309         unsigned (*next_fn)(struct pci_dev *, unsigned) = no_next_fn;
1310
1311         if (only_one_child(bus) && (devfn > 0))
1312                 return 0; /* Already scanned the entire slot */
1313
1314         dev = pci_scan_single_device(bus, devfn);
1315         if (!dev) {
1316 #ifdef pcibios_scan_all_fns
1317                 if (!pcibios_scan_all_fns(bus, devfn))
1318 #endif
1319                 return 0;
1320         } else if (!dev->is_added)
1321                 nr++;
1322
1323         if (pci_ari_enabled(bus))
1324                 next_fn = next_ari_fn;
1325 #ifdef pcibios_scan_all_fns
1326         else if (pcibios_scan_all_fns(bus, devfn))
1327                 next_fn = next_trad_fn;
1328 #endif
1329         else if (dev->multifunction)
1330                 next_fn = next_trad_fn;
1331
1332         for (fn = next_fn(dev, 0); fn > 0; fn = next_fn(dev, fn)) {
1333                 dev = pci_scan_single_device(bus, devfn + fn);
1334                 if (dev) {
1335                         if (!dev->is_added)
1336                                 nr++;
1337                         dev->multifunction = 1;
1338                 }
1339         }
1340
1341         /* only one slot has pcie device */
1342         if (bus->self && nr)
1343                 pcie_aspm_init_link_state(bus->self);
1344
1345         return nr;
1346 }
1347
1348 static int pcie_find_smpss(struct pci_dev *dev, void *data)
1349 {
1350         u8 *smpss = data;
1351
1352         if (!pci_is_pcie(dev))
1353                 return 0;
1354
1355         /* For PCIE hotplug enabled slots not connected directly to a
1356          * PCI-E root port, there can be problems when hotplugging
1357          * devices.  This is due to the possibility of hotplugging a
1358          * device into the fabric with a smaller MPS that the devices
1359          * currently running have configured.  Modifying the MPS on the
1360          * running devices could cause a fatal bus error due to an
1361          * incoming frame being larger than the newly configured MPS.
1362          * To work around this, the MPS for the entire fabric must be
1363          * set to the minimum size.  Any devices hotplugged into this
1364          * fabric will have the minimum MPS set.  If the PCI hotplug
1365          * slot is directly connected to the root port and there are not
1366          * other devices on the fabric (which seems to be the most
1367          * common case), then this is not an issue and MPS discovery
1368          * will occur as normal.
1369          */
1370         if (dev->is_hotplug_bridge && (!list_is_singular(&dev->bus->devices) ||
1371              (dev->bus->self &&
1372               dev->bus->self->pcie_type != PCI_EXP_TYPE_ROOT_PORT)))
1373                 *smpss = 0;
1374
1375         if (*smpss > dev->pcie_mpss)
1376                 *smpss = dev->pcie_mpss;
1377
1378         return 0;
1379 }
1380
1381 static void pcie_write_mps(struct pci_dev *dev, int mps)
1382 {
1383         int rc;
1384
1385         if (pcie_bus_config == PCIE_BUS_PERFORMANCE) {
1386                 mps = 128 << dev->pcie_mpss;
1387
1388                 if (dev->pcie_type != PCI_EXP_TYPE_ROOT_PORT && dev->bus->self)
1389                         /* For "Performance", the assumption is made that
1390                          * downstream communication will never be larger than
1391                          * the MRRS.  So, the MPS only needs to be configured
1392                          * for the upstream communication.  This being the case,
1393                          * walk from the top down and set the MPS of the child
1394                          * to that of the parent bus.
1395                          *
1396                          * Configure the device MPS with the smaller of the
1397                          * device MPSS or the bridge MPS (which is assumed to be
1398                          * properly configured at this point to the largest
1399                          * allowable MPS based on its parent bus).
1400                          */
1401                         mps = min(mps, pcie_get_mps(dev->bus->self));
1402         }
1403
1404         rc = pcie_set_mps(dev, mps);
1405         if (rc)
1406                 dev_err(&dev->dev, "Failed attempting to set the MPS\n");
1407 }
1408
1409 static void pcie_write_mrrs(struct pci_dev *dev)
1410 {
1411         int rc, mrrs;
1412
1413         /* In the "safe" case, do not configure the MRRS.  There appear to be
1414          * issues with setting MRRS to 0 on a number of devices.
1415          */
1416         if (pcie_bus_config != PCIE_BUS_PERFORMANCE)
1417                 return;
1418
1419         /* For Max performance, the MRRS must be set to the largest supported
1420          * value.  However, it cannot be configured larger than the MPS the
1421          * device or the bus can support.  This should already be properly
1422          * configured by a prior call to pcie_write_mps.
1423          */
1424         mrrs = pcie_get_mps(dev);
1425
1426         /* MRRS is a R/W register.  Invalid values can be written, but a
1427          * subsequent read will verify if the value is acceptable or not.
1428          * If the MRRS value provided is not acceptable (e.g., too large),
1429          * shrink the value until it is acceptable to the HW.
1430          */
1431         while (mrrs != pcie_get_readrq(dev) && mrrs >= 128) {
1432                 rc = pcie_set_readrq(dev, mrrs);
1433                 if (!rc)
1434                         break;
1435
1436                 dev_warn(&dev->dev, "Failed attempting to set the MRRS\n");
1437                 mrrs /= 2;
1438         }
1439
1440         if (mrrs < 128)
1441                 dev_err(&dev->dev, "MRRS was unable to be configured with a "
1442                         "safe value.  If problems are experienced, try running "
1443                         "with pci=pcie_bus_safe.\n");
1444 }
1445
1446 static int pcie_bus_configure_set(struct pci_dev *dev, void *data)
1447 {
1448         int mps, orig_mps;
1449
1450         if (!pci_is_pcie(dev))
1451                 return 0;
1452
1453         mps = 128 << *(u8 *)data;
1454         orig_mps = pcie_get_mps(dev);
1455
1456         pcie_write_mps(dev, mps);
1457         pcie_write_mrrs(dev);
1458
1459         dev_info(&dev->dev, "PCI-E Max Payload Size set to %4d/%4d (was %4d), "
1460                  "Max Read Rq %4d\n", pcie_get_mps(dev), 128 << dev->pcie_mpss,
1461                  orig_mps, pcie_get_readrq(dev));
1462
1463         return 0;
1464 }
1465
1466 /* pcie_bus_configure_settings requires that pci_walk_bus work in a top-down,
1467  * parents then children fashion.  If this changes, then this code will not
1468  * work as designed.
1469  */
1470 void pcie_bus_configure_settings(struct pci_bus *bus, u8 mpss)
1471 {
1472         u8 smpss;
1473
1474         if (!pci_is_pcie(bus->self))
1475                 return;
1476
1477         if (pcie_bus_config == PCIE_BUS_TUNE_OFF)
1478                 return;
1479
1480         /* FIXME - Peer to peer DMA is possible, though the endpoint would need
1481          * to be aware to the MPS of the destination.  To work around this,
1482          * simply force the MPS of the entire system to the smallest possible.
1483          */
1484         if (pcie_bus_config == PCIE_BUS_PEER2PEER)
1485                 smpss = 0;
1486
1487         if (pcie_bus_config == PCIE_BUS_SAFE) {
1488                 smpss = mpss;
1489
1490                 pcie_find_smpss(bus->self, &smpss);
1491                 pci_walk_bus(bus, pcie_find_smpss, &smpss);
1492         }
1493
1494         pcie_bus_configure_set(bus->self, &smpss);
1495         pci_walk_bus(bus, pcie_bus_configure_set, &smpss);
1496 }
1497 EXPORT_SYMBOL_GPL(pcie_bus_configure_settings);
1498
1499 unsigned int __devinit pci_scan_child_bus(struct pci_bus *bus)
1500 {
1501         unsigned int devfn, pass, max = bus->secondary;
1502         struct pci_dev *dev;
1503
1504         dev_dbg(&bus->dev, "scanning bus\n");
1505
1506         /* Go find them, Rover! */
1507         for (devfn = 0; devfn < 0x100; devfn += 8)
1508                 pci_scan_slot(bus, devfn);
1509
1510         /* Reserve buses for SR-IOV capability. */
1511         max += pci_iov_bus_range(bus);
1512
1513         /*
1514          * After performing arch-dependent fixup of the bus, look behind
1515          * all PCI-to-PCI bridges on this bus.
1516          */
1517         if (!bus->is_added) {
1518                 dev_dbg(&bus->dev, "fixups for bus\n");
1519                 pcibios_fixup_bus(bus);
1520                 if (pci_is_root_bus(bus))
1521                         bus->is_added = 1;
1522         }
1523
1524         for (pass=0; pass < 2; pass++)
1525                 list_for_each_entry(dev, &bus->devices, bus_list) {
1526                         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1527                             dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1528                                 max = pci_scan_bridge(bus, dev, max, pass);
1529                 }
1530
1531         /*
1532          * We've scanned the bus and so we know all about what's on
1533          * the other side of any bridges that may be on this bus plus
1534          * any devices.
1535          *
1536          * Return how far we've got finding sub-buses.
1537          */
1538         dev_dbg(&bus->dev, "bus scan returning with max=%02x\n", max);
1539         return max;
1540 }
1541
1542 struct pci_bus *pci_create_root_bus(struct device *parent, int bus,
1543                 struct pci_ops *ops, void *sysdata, struct list_head *resources)
1544 {
1545         int error, i;
1546         struct pci_bus *b, *b2;
1547         struct device *dev;
1548         struct pci_bus_resource *bus_res, *n;
1549         struct resource *res;
1550
1551         b = pci_alloc_bus();
1552         if (!b)
1553                 return NULL;
1554
1555         dev = kzalloc(sizeof(*dev), GFP_KERNEL);
1556         if (!dev) {
1557                 kfree(b);
1558                 return NULL;
1559         }
1560
1561         b->sysdata = sysdata;
1562         b->ops = ops;
1563
1564         b2 = pci_find_bus(pci_domain_nr(b), bus);
1565         if (b2) {
1566                 /* If we already got to this bus through a different bridge, ignore it */
1567                 dev_dbg(&b2->dev, "bus already known\n");
1568                 goto err_out;
1569         }
1570
1571         down_write(&pci_bus_sem);
1572         list_add_tail(&b->node, &pci_root_buses);
1573         up_write(&pci_bus_sem);
1574
1575         dev->parent = parent;
1576         dev->release = pci_release_bus_bridge_dev;
1577         dev_set_name(dev, "pci%04x:%02x", pci_domain_nr(b), bus);
1578         error = device_register(dev);
1579         if (error)
1580                 goto dev_reg_err;
1581         b->bridge = get_device(dev);
1582         device_enable_async_suspend(b->bridge);
1583         pci_set_bus_of_node(b);
1584
1585         if (!parent)
1586                 set_dev_node(b->bridge, pcibus_to_node(b));
1587
1588         b->dev.class = &pcibus_class;
1589         b->dev.parent = b->bridge;
1590         dev_set_name(&b->dev, "%04x:%02x", pci_domain_nr(b), bus);
1591         error = device_register(&b->dev);
1592         if (error)
1593                 goto class_dev_reg_err;
1594
1595         /* Create legacy_io and legacy_mem files for this bus */
1596         pci_create_legacy_files(b);
1597
1598         b->number = b->secondary = bus;
1599
1600         /* Add initial resources to the bus */
1601         list_for_each_entry_safe(bus_res, n, resources, list)
1602                 list_move_tail(&bus_res->list, &b->resources);
1603
1604         if (parent)
1605                 dev_info(parent, "PCI host bridge to bus %s\n", dev_name(&b->dev));
1606         else
1607                 printk(KERN_INFO "PCI host bridge to bus %s\n", dev_name(&b->dev));
1608
1609         pci_bus_for_each_resource(b, res, i) {
1610                 if (res)
1611                         dev_info(&b->dev, "root bus resource %pR\n", res);
1612         }
1613
1614         return b;
1615
1616 class_dev_reg_err:
1617         device_unregister(dev);
1618 dev_reg_err:
1619         down_write(&pci_bus_sem);
1620         list_del(&b->node);
1621         up_write(&pci_bus_sem);
1622 err_out:
1623         kfree(dev);
1624         kfree(b);
1625         return NULL;
1626 }
1627
1628 struct pci_bus * __devinit pci_scan_root_bus(struct device *parent, int bus,
1629                 struct pci_ops *ops, void *sysdata, struct list_head *resources)
1630 {
1631         struct pci_bus *b;
1632
1633         b = pci_create_root_bus(parent, bus, ops, sysdata, resources);
1634         if (!b)
1635                 return NULL;
1636
1637         b->subordinate = pci_scan_child_bus(b);
1638         pci_bus_add_devices(b);
1639         return b;
1640 }
1641 EXPORT_SYMBOL(pci_scan_root_bus);
1642
1643 /* Deprecated; use pci_scan_root_bus() instead */
1644 struct pci_bus * __devinit pci_scan_bus_parented(struct device *parent,
1645                 int bus, struct pci_ops *ops, void *sysdata)
1646 {
1647         LIST_HEAD(resources);
1648         struct pci_bus *b;
1649
1650         pci_add_resource(&resources, &ioport_resource);
1651         pci_add_resource(&resources, &iomem_resource);
1652         b = pci_create_root_bus(parent, bus, ops, sysdata, &resources);
1653         if (b)
1654                 b->subordinate = pci_scan_child_bus(b);
1655         else
1656                 pci_free_resource_list(&resources);
1657         return b;
1658 }
1659 EXPORT_SYMBOL(pci_scan_bus_parented);
1660
1661 struct pci_bus * __devinit pci_scan_bus(int bus, struct pci_ops *ops,
1662                                         void *sysdata)
1663 {
1664         LIST_HEAD(resources);
1665         struct pci_bus *b;
1666
1667         pci_add_resource(&resources, &ioport_resource);
1668         pci_add_resource(&resources, &iomem_resource);
1669         b = pci_create_root_bus(NULL, bus, ops, sysdata, &resources);
1670         if (b) {
1671                 b->subordinate = pci_scan_child_bus(b);
1672                 pci_bus_add_devices(b);
1673         } else {
1674                 pci_free_resource_list(&resources);
1675         }
1676         return b;
1677 }
1678 EXPORT_SYMBOL(pci_scan_bus);
1679
1680 #ifdef CONFIG_HOTPLUG
1681 /**
1682  * pci_rescan_bus - scan a PCI bus for devices.
1683  * @bus: PCI bus to scan
1684  *
1685  * Scan a PCI bus and child buses for new devices, adds them,
1686  * and enables them.
1687  *
1688  * Returns the max number of subordinate bus discovered.
1689  */
1690 unsigned int __ref pci_rescan_bus(struct pci_bus *bus)
1691 {
1692         unsigned int max;
1693         struct pci_dev *dev;
1694
1695         max = pci_scan_child_bus(bus);
1696
1697         down_read(&pci_bus_sem);
1698         list_for_each_entry(dev, &bus->devices, bus_list)
1699                 if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1700                     dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1701                         if (dev->subordinate)
1702                                 pci_bus_size_bridges(dev->subordinate);
1703         up_read(&pci_bus_sem);
1704
1705         pci_bus_assign_resources(bus);
1706         pci_enable_bridges(bus);
1707         pci_bus_add_devices(bus);
1708
1709         return max;
1710 }
1711 EXPORT_SYMBOL_GPL(pci_rescan_bus);
1712
1713 EXPORT_SYMBOL(pci_add_new_bus);
1714 EXPORT_SYMBOL(pci_scan_slot);
1715 EXPORT_SYMBOL(pci_scan_bridge);
1716 EXPORT_SYMBOL_GPL(pci_scan_child_bus);
1717 #endif
1718
1719 static int __init pci_sort_bf_cmp(const struct device *d_a, const struct device *d_b)
1720 {
1721         const struct pci_dev *a = to_pci_dev(d_a);
1722         const struct pci_dev *b = to_pci_dev(d_b);
1723
1724         if      (pci_domain_nr(a->bus) < pci_domain_nr(b->bus)) return -1;
1725         else if (pci_domain_nr(a->bus) > pci_domain_nr(b->bus)) return  1;
1726
1727         if      (a->bus->number < b->bus->number) return -1;
1728         else if (a->bus->number > b->bus->number) return  1;
1729
1730         if      (a->devfn < b->devfn) return -1;
1731         else if (a->devfn > b->devfn) return  1;
1732
1733         return 0;
1734 }
1735
1736 void __init pci_sort_breadthfirst(void)
1737 {
1738         bus_sort_breadthfirst(&pci_bus_type, &pci_sort_bf_cmp);
1739 }