linux/mm/percpu-km.c

b0c9778bSTejun Heo/*
b0c9778bSTejun Heo * mm/percpu-km.c - kernel memory based chunk allocation
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * Copyright (C) 2010		SUSE Linux Products GmbH
b0c9778bSTejun Heo * Copyright (C) 2010		Tejun Heo <tj@kernel.org>
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * This file is released under the GPLv2.
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * Chunks are allocated as a contiguous kernel memory using gfp
b0c9778bSTejun Heo * allocation.  This is to be used on nommu architectures.
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * To use percpu-km,
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * - define CONFIG_NEED_PER_CPU_KM from the arch Kconfig.
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * - CONFIG_NEED_PER_CPU_PAGE_FIRST_CHUNK must not be defined.  It's
b0c9778bSTejun Heo *   not compatible with PER_CPU_KM.  EMBED_FIRST_CHUNK should work
b0c9778bSTejun Heo *   fine.
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * - NUMA is not supported.  When setting up the first chunk,
b0c9778bSTejun Heo *   @cpu_distance_fn should be NULL or report all CPUs to be nearer
b0c9778bSTejun Heo *   than or at LOCAL_DISTANCE.
b0c9778bSTejun Heo *
b0c9778bSTejun Heo * - It's best if the chunk size is power of two multiple of
b0c9778bSTejun Heo *   PAGE_SIZE.  Because each chunk is allocated as a contiguous
b0c9778bSTejun Heo *   kernel memory block using alloc_pages(), memory will be wasted if
b0c9778bSTejun Heo *   chunk size is not aligned.  percpu-km code will whine about it.
b0c9778bSTejun Heo */
b0c9778bSTejun Heo
bbddff05STejun Heo#if defined(CONFIG_SMP) && defined(CONFIG_NEED_PER_CPU_PAGE_FIRST_CHUNK)
b0c9778bSTejun Heo#error "contiguous percpu allocation is incompatible with paged first chunk"
b0c9778bSTejun Heo#endif
b0c9778bSTejun Heo
b0c9778bSTejun Heo#include <linux/log2.h>
b0c9778bSTejun Heo
a93ace48STejun Heostatic int pcpu_populate_chunk(struct pcpu_chunk *chunk,
a93ace48STejun Heo			       int page_start, int page_end)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	return 0;
b0c9778bSTejun Heo}
b0c9778bSTejun Heo
a93ace48STejun Heostatic void pcpu_depopulate_chunk(struct pcpu_chunk *chunk,
a93ace48STejun Heo				  int page_start, int page_end)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	/* nada */
b0c9778bSTejun Heo}
b0c9778bSTejun Heo
b0c9778bSTejun Heostatic struct pcpu_chunk *pcpu_create_chunk(void)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	const int nr_pages = pcpu_group_sizes[0] >> PAGE_SHIFT;
b0c9778bSTejun Heo	struct pcpu_chunk *chunk;
b0c9778bSTejun Heo	struct page *pages;
b0c9778bSTejun Heo	int i;
b0c9778bSTejun Heo
b0c9778bSTejun Heo	chunk = pcpu_alloc_chunk();
b0c9778bSTejun Heo	if (!chunk)
b0c9778bSTejun Heo		return NULL;
b0c9778bSTejun Heo
b0c9778bSTejun Heo	pages = alloc_pages(GFP_KERNEL, order_base_2(nr_pages));
b0c9778bSTejun Heo	if (!pages) {
b0c9778bSTejun Heo		pcpu_free_chunk(chunk);
b0c9778bSTejun Heo		return NULL;
b0c9778bSTejun Heo	}
b0c9778bSTejun Heo
b0c9778bSTejun Heo	for (i = 0; i < nr_pages; i++)
b0c9778bSTejun Heo		pcpu_set_page_chunk(nth_page(pages, i), chunk);
b0c9778bSTejun Heo
b0c9778bSTejun Heo	chunk->data = pages;
b0c9778bSTejun Heo	chunk->base_addr = page_address(pages) - pcpu_group_offsets[0];
a63d4ac4STejun Heo
b38d08f3STejun Heo	spin_lock_irq(&pcpu_lock);
*b539b87fSTejun Heo	pcpu_chunk_populated(chunk, 0, nr_pages);
b38d08f3STejun Heo	spin_unlock_irq(&pcpu_lock);
a63d4ac4STejun Heo
b0c9778bSTejun Heo	return chunk;
b0c9778bSTejun Heo}
b0c9778bSTejun Heo
b0c9778bSTejun Heostatic void pcpu_destroy_chunk(struct pcpu_chunk *chunk)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	const int nr_pages = pcpu_group_sizes[0] >> PAGE_SHIFT;
b0c9778bSTejun Heo
b0c9778bSTejun Heo	if (chunk && chunk->data)
b0c9778bSTejun Heo		__free_pages(chunk->data, order_base_2(nr_pages));
b0c9778bSTejun Heo	pcpu_free_chunk(chunk);
b0c9778bSTejun Heo}
b0c9778bSTejun Heo
b0c9778bSTejun Heostatic struct page *pcpu_addr_to_page(void *addr)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	return virt_to_page(addr);
b0c9778bSTejun Heo}
b0c9778bSTejun Heo
b0c9778bSTejun Heostatic int __init pcpu_verify_alloc_info(const struct pcpu_alloc_info *ai)
b0c9778bSTejun Heo{
b0c9778bSTejun Heo	size_t nr_pages, alloc_pages;
b0c9778bSTejun Heo
b0c9778bSTejun Heo	/* all units must be in a single group */
b0c9778bSTejun Heo	if (ai->nr_groups != 1) {
b0c9778bSTejun Heo		printk(KERN_CRIT "percpu: can't handle more than one groups\n");
b0c9778bSTejun Heo		return -EINVAL;
b0c9778bSTejun Heo	}
b0c9778bSTejun Heo
b0c9778bSTejun Heo	nr_pages = (ai->groups[0].nr_units * ai->unit_size) >> PAGE_SHIFT;
b0c9778bSTejun Heo	alloc_pages = roundup_pow_of_two(nr_pages);
b0c9778bSTejun Heo
b0c9778bSTejun Heo	if (alloc_pages > nr_pages)
b0c9778bSTejun Heo		printk(KERN_WARNING "percpu: wasting %zu pages per chunk\n",
b0c9778bSTejun Heo		       alloc_pages - nr_pages);
b0c9778bSTejun Heo
b0c9778bSTejun Heo	return 0;
b0c9778bSTejun Heo}